ဒေတာ သတင်းပညာ၏ သမိုင်းကြောင်းအကျဉ်း
လွန်ခဲ့သော ဆယ်နှစ် သို့မဟုတ် ယင်းကာလအတွင်း ဒေတာ သတင်းပညာအကြောင်း ပြောဆိုမှု အတော်အတန်ရှိခဲ့သော်လည်း ဓလေ့ထုံးစံအသစ်တစ်ခု ဖြစ်ဖို့ အတော်လေး ဝေးနေဆဲပါ။ ၎င်း၏ အစောဆုံး ရက်စွဲ ဥပမာမှာ ၁၉ ရာစု အလယ်ပိုင်း ဖြစ်ပါသည်။ သတင်းစာဆရာနှင့် သူနာပြုသူ ဖလော်ရန့်စ် နိုက်တင်ဂေးလ်က ၁၈၅၈ အတွင်း ခရိုင်မင်း စစ်ပွဲကာလမှာ အင်္ဂလိပ် စစ်သားများ၏ အသေအပျောက်ဒေတာကို ထုတ်ပြန်ခဲ့ပြီး ဖြစ်ပါသည်။
အဲဒီအချိန်ကတည်းက ပြောင်းလဲလာခဲ့သည့်အရာမှာ ကွန်ပျူတာပေါ်ထွန်းစနှင့် အများပြည်သူ ဒေတာများ၏ လွတ်လပ်မှုတို့ ဖြစ်သည်။ သတင်းစာဆရာတိုင်း၏ လက်ထဲတွင် ၎င်းတို့အား တွက်ချက်မှုများနှင့် ရှာဖွေမှုများကို အလွန်အမင်း အကျိုးများသော ပုံစံဖြင့် ဆောင်ရွက်နိုင်စေပြီး ဒေတာများ၏ နက္ခတ္တဗေဒဆိုင်ရာ ပမာဏကို စီစဉ်လုပ်ဆောင်ရန် ကိရိယာတစ်ခု ရှိပါသည်။ အားလုံးကျန်တာကတော့ ကပ်ငြိမ်သွားဖို့ပါပဲ (တကယ်တော့ ဗာကျူရယ်နည်းဖြင့်)။
ဒေတာဆိုတာ ဘာလဲ။
မကြာခဏဆိုသလို ဒေတာ သတင်းပညာအကြောင်း ပြောသည့်အခါ လူအများက အလုပ်လက်မဲ့ နှုန်းထားများအကြောင်းကို တွေးတောကြပါသည်။ ထို့အပြင် ၎င်းမှာ ပုံမှန်ဖြစ်ပါသည်၊ သတင်းစာများတွင် တွေ့ရလေ့ရှိသည့် ကားချပ် ဖြစ်နိုင်ပါသည်။ သို့သော် ဒေတာနှင့် ကိန်းဂဏန်များမှာ တစ်ခုတည်းမဟုတ်သည်ကို သိထားပေးပါ။ ဥပမာ ယူကေတွင် အလုပ်လက်မဲ့ နှုန်းကို သီးခြား ဖော်မြူလာများသုံး၍ ONS စာရင်းအင်းပညာရှင်များက ပြင်ဆင်ထားသည့် Jobcentre Plus ဒေတာများမှ ရယူထားသည်။
ဒေတာအပိုင်းအစမှာ တိကျ၊ ထူးခြားပြီး သတ်မှတ်ထားသည့် အချက်အလက် ဖြစ်ပါသည်။ ဒေတာ အမျိုးအစား လေးမျိုး ရှိပါသည်-
- ဒေတာမှာ စာသား ဖြစ်နိုင်သည်- သင်၏ မိသားစုနာမည်မှာ ဒေတာ အပိုင်းအစ ဖြစ်သည်
- ဒေတာမှာ နံပါတ် ဖြစ်နိုင်သည်- သင့်အသက်မှာ ဒေတာ အပိုင်းအစ ဖြစ်သည်
- ဒေတာမှာ မှန် သို့မဟုတ် မှား တစ်ခုခု ဖြစ်နိုင်သည်၊ ၎င်းကို လုပ်ငန်းတွင် Boolean ဒေတာ အမျိုးအစားဟု သိကြသည်၊ သင်က ဗြိတိသျှလူမျိုးလား။ မှန်လား။ မှားလား။ အဖြေမှာ ဒေတာ အပိုင်းအစ ဖြစ်သည်။
- ဒေတာမှာ အခင်းအကျင်းဟု သိကြသည့် အခြား ဒေတာ အပိုင်းအစများစွာ စုပေါင်းခြင်း ဖြစ်နိုင်ပါသည်- “Clive၊ ၁၈ အမှတ်” သည် စာသား ဒေတာ၊ နံပါတ်ဒေတာနှင့် Boolean ဒေတာတို့ ပါဝင်သည့် အခင်းအကျင်း တစ်ခု ဖြစ်သည်။
စာရင်းစာရွက်ဖိုင်များနှင့် မဏ္ဍိုင် ဇယားကွက်များ
သီအိုရီကို ကျော်လွန်၍ ဒေတာ သတင်းပညာသည် သင်လုံးဝသိထားသည့် ဆော့ဖ်ဝဲ အပိုင်းအစကို အသုံးပြု၍ အားလုံးအပေါ်မှာ ရှိသော်လည်း တစ်ခါတစ်ရံတွင် ကြောက်ဖို့ ကောင်းပါသည်- Excel (သို့မဟုတ် တခြား စာရင်းစာရွက် ဆော့ဖ်ဝဲ အမျိုးအစား တစ်မျိုးမျိုး)။ Excel သည် ဒေတာ သတင်းပညာအတွက် အကောင်းဆုံး ကိရိယာတစ်မျိုး ဖြစ်သည်။ ၎င်းကို အနည်းငယ် အသုံးပြုရန် သင်လေ့လာပါက အလွန်ရှုပ်ထွေးသော တွက်ချက်မှုများကို အလွယ်တကူ ပြုလုပ်နိုင်စေရန်၊ ပျမ်းမျှနှုန်းများကို တွက်ချက်ရန်၊ အဖြစ်အပျက် အရေအတွက်တစ်ခုထိကို ရေတွက်ရန်၊ စာသားများ၏ အစိတ်အပိုင်းအချို့ကို ရှာဖွေရန်၊ အစရှိသည်တို့ကို ပြုလုပ်နိုင်စေပါမည်။
အကြောင်းအရာကို အနည်းငယ် နှိုက်နှိုက်ချွတ်ချွတ် ဝင်ကြည့်ပါက မဏ္ဍိုင် ဇယားကွက်များကို သင်သိရှိနိုင်ပါသည် (၎င်းမှာ ထင်သလောက် မရှုပ်ထွေးပါ၊ ကျွန်ုပ်တို့ ကတိပေးပါသည်)။ ဤကိရိယာကို အသုံးပြု၍ သင်၏ စုံစမ်းစစ်ဆေးခြင်းများတွင် အကူအညီဖြစ်စေမည့် ပင်ပ အချက်အလက်ကို ဖြတ်တောက်ရန် တန်းများနှင့် ကော်လံများစွာပါသည့် ဒေတာဘေ့စ်များ တစ်လျှောက်ကို သင်ခွဲစီနိုင်ပါမည်။
သင်အနည်းငယ် ပိုသိလိုပါက OpenRefine က သင့်မဟာမိတ် ဖြစ်ပါမည်။ ဤကိရိယာကို အသုံးပြု၍ အကွက်ပေါင်းများစွာကို တစ်ချက်တည်းဖြင့် ရှာဖွေကြည့်နိုင်ပါမည်။