Dmlab | Trendek címkefelhőbe foglalva

Trendek címkefelhőbe foglalva

Gáspár Csaba

2010.01.16. • olvasási idő:

Nem volt időm végigolvasni a bi.hu oldalon megjelent BI trendekről szóló híreket, gondoltam mégis szerzek benyomásokat, ezért Wordle címkefelhő rajzolásával megnéztem a cikkek tartalmát.

Annyira megtetszett az eredmény, hogy egy mélyebb elemzésbe kezdtem: kilenc 2010-re vonatkozó és másik kilenc 2008-2009 évre vonatkozóan született előrejelzést gyűjtöttem össze, és csináltam belőle egy színkódolással kiegészített címkefelhőt.

Az alábbi ábrán látható az eredmény (nagyobb méretben). A szavak és szópárok mérete azzal arányos, hogy az elemzésben hányszor szerepel a szó a 2010-re vonatkozó előrejelzésekben. Ennél is fontosabb a szavak színe: minél sötétebb kék egy szó, annál inkább igaz rá, hogy az előfordulási száma csökkent az évek során, míg minél pirosabb, bordóbb egy szó, annál magasabb mértékben nőtt a szó előfordulása a két dokumentumhalmazban.

Első körben nézzük a kihűlő szavakat. Igazán nagy csökkenés esetén persze a szó is kis méretű lesz, hiszen a szó 2010-ben keveset szerepelt. A nagy vesztesek listájában vannak érdekes és meglepő szavak: “text”“hp”“search”“governance”. Ebből a legnagyobb zuhanást a “search” hozta, és valóban, a korábban hangoztatott BI és a keresés konvergenciájáról szóló jóslatok lényegében eltűntek a legújabb előrejelzésekből.

Talán izgalmasabbak a feltörekvő szavak, ezek nevezhetjük lényegében az aktuális trendeknek:

  • open source
  • visualization
  • social network
  • real-time
  • saas / software as a service
  • cloud computing
  • performance management
  • collaboration
  • excel
  • predictive modeling
  • predictive analytics

Adatbányászattal foglalkozó blogként persze külön figyeltük az ide vágó kifejezéseket. Ugyan a “data mining” szó hűlni kezdett, de a téma korántsem: a felfutó kifejezésként megjelenő “predictive modeling” vagy a “predictive analytics” kifejezések jóval gyorsabban erősödtek, mint a “data mining” süllyedt.

A vendorokról is sokat beszélnek az elemzések, de néhány fel is jutott a gyakori szavak közé: a “hp” és a “microsoft” kékkel, míg az “oracle”“ibm” és külön márkanévként a “cognos” szavak pirossal kerültek fel az ábrára.

Természetesen 18 cikk szavainak gyakoriságából messzemenő következtetéseket levonni nem lehet, de azt állíthatjuk, hogy a fejünkben kialakult képet azért mégiscsak alátámasztja ez az elemzés. Aki pedig pontosabban szeretne utánanézni a dolgoknak, annak elsőre javaslom a Google Trends szolgáltatását.