Kdo na Twitteru udává trendy, kdo je na okraji a o čem se mluví? Analýza pomocí NodeXL řekne o konkurenci všechno

Twitter NodeXL

V dnešním článku se podíváme na zoubek konkurenci na Twitteru. Existují tuny nástrojů, které vám umožní srovnávat Twitter účty – jak rychle se vyvíjí komunita, kolik mají interakcí a pár dalších ukazatelů, se kterými se pak můžete vytahovat. Nenechte se splést, tyhle údaje se hodí, ale jejich informační hodnota je docela malá.

Jsou ale způsoby, jak z Twitteru vytáhnout informace, které se dají přetavit do konkrétních akcí. Jedním z nich je Social Network Analysis, metoda zkoumání vztahů v sociální síti na základě metadat. Sociálními sítěmi teď myslím samozřejmě Facebook i Twitter, ale také třídu na základce, nebo vaše kolegy v práci.

Díky SNA můžete zjistit, kdo je šéfem třídy a kdo naopak stojí na okraji. Prozradí také, kteří poslanci k sobě mají tak nějak blíž bez ohledu na politickou příslušnost, třeba na základě toho, jak společně hlasují o zákonech. Je také možné sledovat, jak jsou společně propojeny blogy o jídle (pamatujete na “blogrolly”, seznamy odkazů spřátelených blogů?). Užití SNA je nespočet.

Posuneme-li se dál ke konkrétnímu využití v případě Twitteru, lze například zjistit, jaká témata jsou obsažena ve vaší komunitě. Uvidíte také vizualizaci struktury sítě a na základě propojenosti účtů poznáte potenciální uživatele, kteří mohou mít vliv na šíření informace ve vaší sociální síti.Twitter NodeXL

Vstupem do SNA je databáze vazeb mezi dvěma uzly. Kdo s kým hlasuje, s kým se nejčastěji bavím o přestávce, kdo si s kým telefonuje (NSA) a také kdo koho sleduje, lajkuje apod. Každá vazba se nejčastěji vizualizuje jako spojnice mezi body. Čím více máte vazeb, tím více je vámi analyzovaná sociální síť propojena (obrázek 1). Pokud vás zajímá teoretická stránka SNA (měla by), lze se hodně dočíst v knihách Introduction to social network methods (ta je zdarma) a Analyzing Social Media Networks with NodeXL (ta už něco stojí). Můžete zkusit také kurz na coursera.org, bude-li v budoucnu vypsán.

Zadání a parametry analýzy

Dost bylo teorie. Abychom se bavili konkrétně, připravili jsme si konkrétní zadání – chceme zjistit, jak na Twitteru fungují lidi a firmy, které se profesně zabývají tématem značek stejně jako Lovebrand. Pro zjednodušení je nazýváme konkurencí, ale určitě to v našem podání nemá negativní konotaci. Z analýzy tedy chceme zjistit tyto informace:

  1. jak jsou propojeny účty, které se zabývají tématem značek,
  2. koho v rámci této komunity sledovat, s kým se zapojovat do diskuze a
  3. jaká další témata se v komunitě objevují.

Metodologie analýzy

K získání, zpracování a vizualizaci dat používáme nástroj NodeXL (doplněk pro MS Excel) s doplňkem Social Network Importer for NodeXL. Kombinace těchto nástrojů vám umožní stahovat data z různých sociálních sítí bez programování nebo znalosti API. Podkladem pro analýzu dat je seznam uživatelů Twitteru – tento konkrétní je veřejně dostupný a najdete v něm tyto účty: dardzi, hrvnk, thrivnak, brandbakers, fairytailors, cocoon_group, idealisti a náš lovebrandcz. Je škoda, že v době analýzy již nebyl dostupný účet @mindlesscz, který by určitě strukturou sítě zamíchal.

6. lenda 2015 jsme stáhli posledních 200 tweetů od těchto účtů a zjistili, kdo koho označil (mention), nebo komu odpověděl (reply). Jako vazby počítáme také fakt, že někdo někoho sleduje (follow). Odstranili jsme tzv. self-loops, což jsou vazby od uživatele A k uživateli A. Graf (ve smyslu vizualizace vazeb), který vznikl je tzv. směrovaný (directed), rozlišujeme tedy směr vazeb. Je totiž rozdíl v tom, zda někoho sleduji, nebo jsem sledován. Pokud se objevovala několikanásobná vazba (např. zároveň sleduji účet a ještě jsem ho zmínil), byla převedena na váhu vazby (ve vizualizaci je čára symbolizující silnější vazbu tlustší).

Další články v Příručce marketéra najdete tady

Pro vizualizaci jsme využili algoritmu Fruchterman-Reingold. Účty pak byly podle vzájemné blízkosti rozděleny pomocí algoritmu Clauset-Newman-Moore. I když to zní složitě, není – v NodeXL si toto vše můžete snadno nastavit. A právě aby bylo možné analýzu snadno replikovat, popisujeme vše takto detailně.

A protože rádi pomáháme, dáváme k dispozici nastavení celé této SNA analýzy (odkaz vede na Google Drive), které lze do NodeXL importovat. Díky tomu nebudete muset přemýšlet nad tím, jaké metriky si necháte spočítat a jak naformátovat graf, aby dobře vypadal. Na druhou stranu je dobré tomu rozumět a naučit se i trochu teorie, otevře vám to cestu k více různým analýzám.

Na co jsme přišli

Celkem nám do analýzy spadlo 2 842 účtů, které jsou nějak propojeny na základě seznamu účtů v zadání. Už jen kvůli tomu množství je výsledný graf většinou dost nepřehledný (obrázek 2). Mezi těmito účty jsme našli celkem 3 648 vazeb. V analýze máme tedy 6 segmentů, takových komunit v rámci komunity.

node xl1

 

Jak jsou propojeny účty

Abychom se v tom mohli trochu vyznat, je třeba z grafu v NodeXL odfiltrovat účty, které jsou nejméně propojeny. Pak už lze vidět konkrétní poznatky. Je vidět, že struktura nejvíce propojených účtů reflektuje fyzický svět, tedy to kdo se s kým “baví” i mimo Twitter. Protože analyzujeme naše prostředí, které známe, víme, že více propojené účty jsou lidi a firmy, které spolu pracují. U některých účtů jsme zase naopak objevili propojení, o kterých jsme neměli tušení a teď jen musíme přijít na to, co znamenají.

Tady je vhodné poznamenat, že takováto vizualizace není cílem této analýzy, i když se s ní dá machrovat před šéfem. Správná vizualizace, v našem případě ta po odfiltrování, ukazuje, kde máte začít odpovídat na otázky typu proč se účet “xy” nachází zrovna v tomto segmentu? SNA vám ukáže kde hledat a často bude třeba přečíst si související tweety, případně najít i informace mimo Twitter.

node xl2

 

Koho v rámci této komunity sledovat – nejvíce propojení uživatelé

Tato analýza nám také může poradit, jaký účet je v rámci této komunity dobré sledovat. Vyjdeme z předpokladu, že je dobré sledovat (a pak také získat sledování) nejlépe propojené účty. “Nejlépe propojené” v tomto případě znamenají účty s nejvyšší hodnotou metriky “betweenes centrality”.

“It is equal to the number of shortest paths from all vertices to all others that pass through that node. A node with high betweenness centrality has a large influence on the transfer of items through the network, under the assumption that item transfer follows the shortest paths.” (Wikipedia)

Twitter NodeXL

NodeXL vám dokáže tuto metriky nejen spočítat, ale také vám rovnou ukáže TOP 10 účtů podle této metriky. Hodně důležité je podívat na to, jaká je distribuce hodnot betweenes centrality v celé komunitě. Často zjistíte, že účtů s opravdu vysokou betweeness centrality je oproti celkovému počtu účtů menšina – jak už to bývá. Určitě je vhodné dodat, že v případě podobných analýz mají účty z analyzovaného seznamu logicky nejvyšší betweenes centrality. Jsou mezi nimi i účty jiných uživatelů a právě ty hledáte.

Twitter NodeXL

Jaká další témata se v komunitě objevují

Kromě všech těchto informací, které si NodeXL stáhne či na základě algoritmů spočítá, lze také využít informace o účtech – např. informace z profilů (bio). Můžete tak zjistit, čím se lidé zabývají. A nejjednodušší vizualizace (ne jediná možná) je wordcloud. V tomto konkrétním jsme využili službu TagCrowd, která ingoruje často frekventovaná slova typu spojky a předložky. Vyloučení těchto slov ale není dokonalé a tak můžete využít seznam takových českých i anglických slov, které jsme si pro podobné účely vytvořili (stahujte zde).

Twitter NodeXL

Na základě těchto informací můžete obohatit třeba vaši obsahovou strategie. Rozhodně to nemůže být jediný podklad pro to, o čem budete psát. Ale čím více menších střípků znalostí posbíráte, tím blíže budete k celkovému obrazu.

Pro případ dalších analýz

Analýza konkurence na Twitteru je jen jednou z mnoha situací, kde lze SNA využít. A s NodeXL jde všechno jednodušeji. Připravit samotnou analýzu a všechno naformátovat opravdu není složité. To, co dělá tuto metodu složitou, je volba vhodné situace, kdy ji využít, příprava a čištění dat a hlavně správná definice zkoumané otázky a použití vhodných parametrů analýzy.

Příručka marketéra Těchinternetů… 

Všechno, co musíte jako marketér umět, na jednom místě. 

Diskuze k článku