Historia fupi ya uandishi wa habari kwa kutumia data
Ingawa imezungumzwa sana kuhusu uandishi wa habari kwa kutumia data katika miaka kumi au zaidi kidogo iliyopita, ukweli ni kwamba si jambo jipya. Mifano yake ya kale zaidi inarudi nyuma hadi katikati ya karne ya 19. Mwandishi wa habari na muuguzi Florence Nightingale tayari alikuwa akichapisha data za vifo vya askari wa Uingereza waliokufa katika Vita ya Crimea mwaka 1858.
Kilichobadilika tangu wakati huo ni kuingia kwa kompyuta na matumizi zaidi ya data za masuala ya umma. Kila mwandishi wa habari ana zana mikononi mwake inayomwezesha kukokotoa na kutafuta kwa njia fanisi kabisa na kuchakata idadi kubwa sana ya data. Kile kilichobaki sasa ni kuingia ndani zaidi (kimtandao, bila shaka).
Data ni nini?
Mara nyingi, ikiongelewa kuhusu uandishi wa habari kwa kutumia data, watu hufikiria viwango vya kukosekana kwa ajira. Na hilo ni jambo la kawaida, pengine ndiyo grafu inayoonekana mara nyingi zaidi katika magazeti. Hata hivyo, ikumbukwe kwamba data na takwimu si kitu kimoja. Kiwango cha kukosekana kwa ajira nchini Uingereza, kwa mfano, hutolewa katika data za Jobcentre Plus ambayo baadae hufanyiwa kazi na wataalamu wa Ofisi ya Takwimu ya Taifa (ONS) kwa kutumia kanuni maalum.
Kipande cha data ni kipengele kilichoainishwa, kifupi, na cha kipekee. Kuna aina nne za data:
- data inaweza kuwa maandishi: jina lako la kwanza ni kipande cha data
- data inaweza kuwa nambari: umri wako ni kipande cha data
- data inaweza kuwa jambo fulani la kweli au la uongo, ambayo inafahamika kama aina ya data ya Boolean: wewe ni Mtanzania? Ndio? Hapana? Jibu husika ni kipande cha data.
- data inaweza kuwa mkusanyiko wa vipande vingine kadhaa vya data, ambavyo hufahamika kama msururu (array): “Musonda, 18, Hapana” ni msururu ulio na vipande vya data ya maandishi, data ya nambari na data ya Boolean.
Lahajedwali na “pivot table”
Kando ya nadharia, uandishi wa habari kwa kutumia data, zaidi ya yote, kwa kutumia programu ambayo unaifahamu, lakini mara nyingi huogopesha: Excel (au aina nyingine yoyote ya programu ya lahajedwali). Excel ndiyo zana bora zaidi kwa uandishi wa habari kwa kutumia data. Ukijifunza kuitumia kidogo tu, itakuwezesha kufanya mahesabu magumu sana kwa urahisi, kukokotoa wastani, kuhesabu idadi ya utokeaji wa kitu, kutafuta sehemu fulani za maandishi, nk.
Ukizama ndani kidogo kwenye programu hiyo, unaweza kumudu “pivot table” (si ngumu kiasi hicho, tunakuahidi). Kwa kutumia zana hii, utaweza kuchambua hifadhi-data kubwa zenye maelfu kadhaa ya safu-mlalo na safu-wima kufikia kiini cha jambo ambalo litakusaidia katika uchunguzi wako.
Na ukitaka kwenda mbele zaidi, OpenRefine itakuwa ndiyo mshirika wako. Kwa kutumia zana hii, utaweza kuperuzi mamilioni ya seli kwa mara moja.