Adatvizualizáció – az adatújságírás motorja

Mielőtt belekezdesz abba, hogy megpróbálod diagramon vagy térképen ábrázolni az adataidat, szánj egy percet annak a végiggondolására, hogy a statikus és interaktív grafikai elemek milyen sok szerepet játszanak az újságírásodban.

A riportkészítés fázisában a képi megjelenítés képes arra, hogy:

  • Segítsen neked azonosítani a témák és kérdéseket a riportod hátralévő részéhez
  • Azonosítsa a kiugró értékeket: a jó történeteket, vagy talán az adataidban rejlő hibákat
  • Segítsen neked tipikus példákat találni.
  • Megmutassa neked a riportodban rejlő hibákat

A képi megjelenítések több szerepet is játszanak a közzétételben:

  • Egy történetben megemlített pontot vonzóbb módon mutatnak be
  • Eltávolítja a felesleges technikai információkat a kötetlen beszédből
  • Különösen akkor, ha ezek interaktívak, és lehetővé teszik a feltárást, biztosítják az átláthatóságot a riportkészítési eljárásoddal kapcsolatban az olvasóid számára

Ezek a szerepkörök azt javasolják, hogy korán és gyakran kellene elkezdened a képi megjelenítéseket a riportod készítése során, akár elkezded használni az elektronikus adatokat vagy rekordokat, akár nem. Ne tartsd ezt olyan külön lépésnek, vagy olyasminek, amit akkor kell figyelembe venni, miután a történetet nagyrészt megírtad. Hagyd, hogy ez a munka vezesse a riportod írását.

Az első lépés néha csak azt jelenti, hogy vizuális formába ülteted át a már megírt jegyzeteidet. Tekintsd meg a 84. ábrán lévő grafikát, amely 2006-ban jelent meg a Washington Postban.

84. ábra Az agrártámogatások időbeli változásai (Washington Post)
84. ábra Az agrártámogatások időbeli változásai (Washington Post)

Ez megmutatja a támogatásokkal kapcsolatos mezőgazdasági jövedelem részének és a legfontosabb eseményeknek az elmúlt 45 évben való alakulását, és ezt több hónapon keresztül készítették. Kihívás volt olyan adatokat találni, amelyeket végig hasonló definíciókkal és hasonló jelentésekkel használhattunk. Az összes csúcs és hullámvölgy kivizsgálása segített nekünk szem előtt tartani az összefüggéseket, miközben a riportunk hátralévő részét írtuk. Ez azt is jelentette, hogy egy házimunka nagyjából befejeződött, mielőtt a történeteket megírtuk.

Íme néhány tipp a vizualizáció használatához, hogy megkezdd az adathalmazaidnak a feltérképezését.

1. tipp: Használj több kis másolatot, hogy gyorsan tájékozódj egy nagy adathalmazban

Ezt a technikát a Washington Postnál használtam, amikor egy olyan tippet vizsgáltunk ki, amely szerint George W. Bush kormánya a támogatásokat politikai, és nem nem anyagi alapon ítélte oda. A legtöbb ilyen támogatási programokat képlet alapján hajtják végre, másokat pedig évekig finanszíroztak, így kíváncsiak voltunk arra, hogy vajon meglátjuk-e a mintát a közel 1500 különböző tetszés szerint kiválasztott adatfolyamok átnézésével.

85. ábra HHS támogatások: az értékgörbék segítséget nyújtanak a történet felderítésében (Washington Post)
85. ábra HHS támogatások: az értékgörbék segítséget nyújtanak a történet felderítésében (Washington Post)

Minden egyes programhoz létrehoztam egy grafikont, az elnökválasztási évet feltüntető piros pontokkal és a kongresszusi évet jelölő zöld pontokkal. A probléma: Igen, több ilyen programban tüskeszerű kiugrás volt az elnökválasztást megelőző hat hónapban – a piros pontok a mellettük lévő maximális számokkal – de ez a rossz választási év. George W. Bush újraválasztási ígérete helyett a csúcs következetesen a 2000-es elnökválasztás mellett volt, amikor Bill Clinton volt a Fehér Házbanés az alelnöke, Al Gore, megpróbált közhivatalt szerezni.

Ezt igazán könnyű volt belátni számtáblázatok helyett inkább egy sor grafikonon, egy interaktív űrlap pedig lehetővé teszi számunkra, hogy ellenőrizzük a támogatások különböző típusait, a régiókat és az ügynökségeket. A kis sokszorosított példányokban szereplő térképek használata lehet egy módja annak, hogy egy olyan statikus képen mutassuk az időt és a helyet, amelyet könnyű összehasonlítani – néha még könnyebb is, mint egy interaktív képen.

Ezt a példát egy PHP-ben írt rövid programmal készítették, de most sokkal könnyebb elkészíteni az Excel 2007 és 2010értékgörbéivel. Edward Tufte, vizualizációs szakértő találta ki ezeket az „élénk, egyszerű, hírszerű grafikákat”, hogy az információkat egy pillanat alatt közvetítsék egy nagy adathalmazon keresztül. Most mindenhol láthatod őket, a tőzsdei árfolyamok alatt lévő kis grafikonoktól a sportokban használt győzelem-veszteség nyilvántartásokig.

2. tipp: Nézd meg az adataidat fejjel lefelé és oldalról

Amikor megpróbálsz megérteni egy történetet vagy egy adathalmazt, nincs rossz módszer arra, hogy megnézd; próbáld ki minden módon, amire csak gondolni tudsz, és más perspektívát fogsz kapni. Ha a bűnözésről írsz riportot, megnézheted az egyik grafikonhalmazt az erőszakos bűncselekményekben egy év alatt bekövetkező változásokról; egy másik lehet a százalékos változás; a másik lehet összehasonlítás más városokkal; egy másik pedig időbeli változás. Használj nyers számokat, százalékokat és indexeket.

Nézd meg őket különböző méretarányokban. Próbáld meg követni azt a szabályt, hogy az x tengelynek a nullán kell lennie. Majd szegd meg ezt a szabályt, és nézd meg, hogy többet tudsz-e meg. Próbáld ki a logaritmusokat és a négyzetgyököket a páratlan eloszlású adatokra.

Tartsd észben azokat a kutatásokat, amelyeket a vizuális érzékeléssel kapcsolatban végeztek. William Cleveland kísérletei azt mutatták, hogy a szem akkor lát változást egy képen, amikor az átlagos dőlésszög körülbelül 45 fokos. Ez azt javasolja, hogy hagyd figyelmen kívül azokat a figyelmeztetéseket, hogy mindig nulláról indulj és ehelyett törekedj a legélesebb grafikára. Egy másik járványtani kutatás azt javasolta, hogy találj egy megcélzott szintet a diagramod határaként. Minden egyes ilyen módszer segít neked abban, hogy különböző módokon lásd az adatokat. Ha már nem mondanak neked semmi újat, akkor tudod, hogy készen vagy.

3. tipp: Ne feltételezz!

Most, hogy már többféle módon megvizsgáltad az adataidat, talán megtaláltad azokat a rekordokat, amelyek nem tűnnek helyesnek – talán nem értetted először, hogy mit jelentettek, vagy van néhány kiugró érték, amelyek úgy tűnnek, mintha elírások lennének, vagy vannak olyan trendek, amelyek visszaeséseknek tűnnek.

Ha bármi olyat szeretnél közzétenni, amely a kezdeti kutatásodon alapul vagy egy kiadott vizualizációban szerepel, meg kell fejtened ezeket a kérdéseket, és nem fogalmazhatsz meg feltételezéseket. Ezek vagy érdekes történetek, vagy hibák; érdekes kihívások a gyakori bölcsességre vagy félreértésre.

Nem szokatlan a helyi önkormányzatok számára, hogy hibákkal teli táblázatokat nyújtsanak, és könnyen félreérthető egy adathalmazban lévő kormány zsargon is.

Először is térj vissza a saját munkádhoz. Elolvastad a dokumentációd, a figyelmeztetéseit, és a probléma az adatok eredeti változatában létezik? Ha a te részedről úgy tűnik, hogy minden rendben van, akkor itt az ideje, hogy felvedd a telefont. Ezt meg kell majd oldanod, ha azt tervezed, hogy felhasználod, így most talán el is kezdheted.

Azt mondják, hogy nem minden hiba fontos. A kampány pénzügyi adatrekordjaiban gyakori, hogy több száz olyan irányítószám van bennük, amelyek nem léteznek egy 100,000 rekordból álló adatbázisban. Addig, amíg nem mind ugyanabban a városban van, vagy egy pályázó városban, az esetenként rossz adatrekord szinte nem számít.

A kérdés, amelyet meg kell kérdezned magadtól az: ha nekem kellene ezt felhasználnom, akkor az olvasóknak lenne egy alapvetően pontos elképzelése arról, hogy az adatok mit mondanak?

4. tipp: Kerüld el a pontossággal kapcsolatos megszállottságot

A másik oldala annak, hogy nem teszünk fel elég kérdést, az a pontossággal kapcsolatos megszállottság, mielőtt az számítana. A feltáró grafikáidnak általában helyesnek kell lennie, de ne aggódj, ha különböző szintűek a kerekítéseid, ha nem teszik ki pontosan a 100 százalékot, vagy ha hiányoznak egy vagy két év adatai a 20-ból. Ez a kutatási folyamat része. Még mindig látni fogod a nagy trendeket és tudni fogod, mit kell összegyűjteni, mielőtt eljön az ideje annak, hogy nyilvánosságra hozd.

Valójában lehet, hogy megfontolod a címkézés és a méretlépték-jelölők eltávolítását ugyanúgy, mint a fentebbi diagramokon, hogy az adatok még általánosabb értelemét kapd.

5. tipp: Hozd létre az esetek és események kronológiáit

Bármilyen bonyolult történet kezdetén kezdd el felépíteni a kulcsfontosságú események és esetek kronológiáit. Használhatod az Excelt, egy Word-dokumentumot, vagy egy speciális eszközt a feladathoz, mint a TimeFlow, de egy bizonyos ponton találni fogsz egy olyan adathalmazt, amelyet mögé tehetsz. Ha ezt rendszeresen átolvasod, meg fogja mutatni neked, milyen hézagok vannak a riportodban, amelyet ki kell töltened.

6. tipp: Találkozz korán és gyakran a grafikai részlegeddel

Ötletelj a lehetséges grafikákról a szerkesztőségedben dolgozó művészekkel és tervezőkkel. Jó módszereik lesznek arra, hogy megvizsgáld az adataidat, javaslataik lesznek arra, hogy ez hogyan működhet interaktívan, és tudják, hogy hogyan kell adatokat és történeteket összekapcsolni. Sokkal könnyebbé fogja tenni a riportod írását, ha már kezdetben tudod, miről kell adatokat gyűjteni, vagy ha riasztani tudod a csapatodat, hogy egy grafika elkészítése nem lehetséges, ha nem tudod összegyűjteni.

TIPPEK A KIADÁSHOZ

Lehet, hogy csak néhány napot vagy néhány órát töltöttél a kutatásoddal, vagy a történetednek esetleg hónapokba került, hogy riport legyen belőle. De ahogy eljön az ideje annak, hogy áttérj a kiadásra, két szempont fontosabbá válik.

Emlékszel arra a hiányzó évre, amely a kezdeti kutatásodban volt? Hirtelen nem tudsz továbbhaladni nélküle. Minden ilyen rossz adatot figyelmen kívül hagytál a riportodban? Vissza fognak térni, hogy kísértsenek téged.

Ennek oka az, hogy nem írhatsz rossz adatokról. Egy grafikához vagy mindened megvan, amire szükséged van, vagy nincs, és nincs középút.

1. Mérd össze az adatgyűjtésbe fektetett erőfeszítést az interaktív grafikával.

Egy interaktív grafikában nincs kibúvó. Ha valóban azt szeretnéd, hogy az olvasóid bármilyen általuk kívánt módon felfedezzék az adatokat, akkor minden adatelemnek olyannak kell lennie, ahogy kérik. A felhasználók bármikor bármilyen hibát találhatnak, és ez hónapokig vagy évekig tudna téged kísérteni.

Ha te készíted a saját adatbázisodat, ez azt jelenti, hogy várhatóan a teljes adatbázist korrektúráznod, a tényeket ellenőrizned és lektorálnod kell Ha kormányzati nyilvántartásokat használsz, el kellene döntened, hogy mennyi szúrópróbaszerű ellenőrzést fogsz végezni, és mit tervezel tenni, ha megtalálod az elkerülhetetlen hibát.

2. Két típusú olvasó számára tervezz

A grafikának – legyen ez akár egy önálló interaktív funkció, vagy egy statikus képi megjelenítés, amely a történetedet kíséri – két különböző típusú olvasónak kellene megfelelnie. Egy pillantásra könnyen érthetőnek kellene lennie, de elég bonyolultnak is ahhoz, hogy valami érdekeset nyújtson olyan emberek számára, akik szeretnének továbblépni. Ha ezt interaktívvá teszed, győződj meg arról, hogy az olvasóid valamivel többet kapnak, mint egyetlen szám vagy név.

3. Közvetíts egyetlen gondolatot – majd egyszerűsítsd

Győződj meg arról, hogy egyetlen olyan dolog van, amelyet szeretnél, hogy az emberek lássanak? Dönts arról az ellenállhatatlan benyomásról, amelyet szeretnél, hogy egy olvasó szerezzen, és tüntess el minden mást. Sok esetben ez az információk eltávolítását jelenti még akkor is, ha az internet lehetővé teszi számodra, hogy minden információt megadj. Hacsak a fő célod nem a riportod átláthatósága, az idővonaladon és a kronológiádban általad összegyűjtött részletes információk többsége nem igazán fontos. Egy statikus képen ez megfélemlítő lesz. Egy interaktív grafikán pedig unalmas lesz.