ഡാറ്റ സയന്‍സ്‌എന്ന മേഖല സ്റ്റാറ്റിസ്റ്റിക്‌സ്, കമ്പ്യൂട്ടര്‍ സയന്‍സ്, ഗണിതശാസ്ത്രം, പ്രവര്‍ത്തനതലത്തിലെ വൈദഗ്ദ്ധ്യം എന്നിങ്ങനെ പല ചേരുവകളുടെ ഒരു മിശ്രിതമാണ്. ഒരു കുടക്കീഴില്‍ ഇവയെക്കൊണ്ടുവന്നു നാമകരണം ചെയ്യുക എന്ന പ്രക്രിയ പുതിയതാണെങ്കിലും പല രീതിയില്‍ ഇവയോരോന്നും വളരെക്കാലമായി നിലനിന്നുപോരുന്നവയാണ്. അത് കൊണ്ട് തന്നെ 'ഡാറ്റ  സയന്റിസ്റ്റ്' എന്ന സ്ഥാനപ്പേരിനപ്പുറത്തു ഇവയിലോരോന്നിനുമൊടുള്ള അഭിരുചിക്കനുസരിച്ചു ഡാറ്റ  സംബന്ധമായ അനേകം ഉപമേഖലകളുണ്ട്. അവയില്‍ പ്രധാനമായവ താഴെ വിവരിച്ചിരിക്കുന്നു. പൊതുവെയുള്ള പ്രവണതകളെ അടിസ്ഥാനമാക്കിയാണ് താഴെയുള്ള വിവരണങ്ങളെങ്കിലും ഓരോ ജോലിയും സ്ഥാപനവും സംഘടനയുമനുസരിച്ചു ഇവയുടെ പേരുകളും ജോലിയുടെ സ്വഭാവത്തിലും മാറ്റങ്ങളുണ്ടായേക്കാം. അതിനാല്‍ ഈ ലേഖനം ഒരു വഴികാട്ടിയായി മാത്രം കണ്ടു ജോലിയെയും ഉപമേഖലയെയും പറ്റി വിശദമായി പഠിച്ച ശേഷം മാത്രം തിരഞ്ഞെടുക്കുക.     

സ്റ്റാറ്റിസ്റ്റിക്‌സിനോട് ശക്തമായ താല്‍പ്പര്യമുള്ളവര്‍ വളരെക്കാലമായി തിരഞ്ഞെടുക്കുന്ന ഒരു തൊഴില്‍ ഉപമേഖലയാണ് 'സ്റ്റാറ്റിസ്റ്റീഷ്യന്‍' എന്നത്. സമൂഹപരമായ പരീക്ഷണങ്ങള്‍ അനവധി നടക്കാറുള്ള സോഷ്യല്‍ സയന്‍സ്, സെന്‍സസ് പോലെയുള്ള സര്‍ക്കാര്‍ പദ്ധതികള്‍, ആരോഗ്യമേഖലയിലെ പരീക്ഷണങ്ങള്‍(ഇവിടെ സാധാരണയായി 'ബയോസ്റ്റാറ്റിസ്റ്റീഷ്യന്‍' എന്ന പ്രത്യേക നാമധാരണവുമുണ്ട്) തുടങ്ങിയ രീതിയിലുള്ള സംരഭങ്ങളിലാണ് സ്റ്റാറ്റിസ്റ്റീഷ്യന്‍ സാധ്യതകള്‍ അനേകവും. സ്റ്റാറ്റിസ്റ്റിക്‌സില്‍ത്തന്നെ ഏതെങ്കിലും തലത്തില്‍ ബിരുദധാരികളായവരാണ് സാധാരണ ഈ മേഖലയിലേക്ക് വരാറുള്ളത്. പൂര്‍വ്വ ജ്ഞാനത്തിനും വൈദഗ്ദ്ധ്യത്തിനും പ്രാധാന്യമുള്ള ഉപമേഖലയാണിത്.

'അനലിസ്റ്റ്' എന്ന ഉപമേഖലയാണ് മറ്റൊന്ന്. പല തലങ്ങള്‍ നിറഞ്ഞ വിസ്തൃതമായ ഒരു ഉപമേഖലയാണിത്. ഒരു സന്ദര്‍ഭം പഠിച്ചു അതിനനുസരിച്ചുള്ള ഉത്തരങ്ങള്‍ കണ്ടെത്തുകയും, അവ നടപ്പിലാക്കുകയും ചെയ്യുന്ന ഒട്ടനവധി ജോലികള്‍ക്ക് ഒന്നിച്ചു പറയുന്ന പേരാണ് 'അനലിസ്റ്റ്'. ശ്രദ്ധിക്കേണ്ട ഒരു കാര്യം, ചിലപ്പോള്‍ ഡേറ്റ സയന്‍സില്‍ പ്രതീക്ഷിക്കുന്നത് പോലെ ഡേറ്റയുമായുള്ള സമ്പര്‍ക്കം പല അനലിസ്റ്റ് ജോലികളിലും ഉണ്ടായില്ലെന്ന് വരാം. അതിനാല്‍ അനലിസ്റ്റ് എന്ന് മാത്രം പേരുള്ള തൊഴിലവസരങ്ങളുടെ വിശദാംശങ്ങള്‍ക്ക് പ്രത്യേക പ്രാധാന്യം നല്‍കണം. മറുവശത്തു പല പേരില്‍ അറിയപ്പെടുന്ന ഇത്തരം അവസരങ്ങളുടെ പ്രതീക്ഷകള്‍ ഒന്നായേക്കാം. ഉദാഹരണത്തിന് ഗൂഗിളിലെ 'പ്രോഡക്റ്റ് അനലിസ്റ്റ്, ഡേറ്റ സയന്‍സ് ' എന്ന ജോലിയും ഫേസ്ബുക്കിലെ 'ഡാറ്റ  സയന്റിസ്റ്റ്, അനലിറ്റിക്‌സ്' എന്ന ജോലിയും, രണ്ടു പേരിലാണെങ്കിലും ചുമതലകളുടെ അടിസ്ഥാനത്തില്‍ ഏറെ സാമ്യതയുള്ളവയാണ്.        

ഈ ഉപമേഖലയില്‍ അല്‍പ്പം ആഴത്തില്‍ ഉറ്റുനോക്കിയാല്‍ കാണാവുന്ന ഒരു ഉപഭാഗമാണ് 'ബിസിനസ്സ് അനലിസ്റ്റ്'. പേര് സൂചിപ്പിക്കുന്നത് പോലെ തന്നെ ഒരു ബിസിനസ്സിന്റെ വളര്‍ച്ചയെ നേരിട്ട് സഹായത്തക്കവിധം പരിഹാരങ്ങള്‍ കണ്ടെത്തുന്ന തരത്തിലുള്ള പ്രോജെക്ടുകളാണ് ഒരു ബിസിനസ്സ് അനലിസ്റ്റ് ചെയ്യാറുള്ളത്. മൈക്രോസോഫ്റ്റ് എക്‌സെലിലുള്ള നൈപുണ്യം ഇത്തരത്തിലുള്ള സാധാരണ അവസരങ്ങള്‍ക്ക് വളരെ പ്രധാനമാകാറുണ്ട്. 

ബിസിനസ്സ് ബോധത്തില്‍ നിന്നും അല്‍പ്പം വഴിമാറി കുറച്ചുകൂടി സാങ്കേതികതയിലേക്കു കടന്നുചെല്ലുമ്പോള്‍ 'ഡാറ്റ  അനലിസ്റ്റ്' എന്ന അവസരമുണ്ട്. ചുമതലകള്‍ ബിസിനസ്സ് അനലിസ്റ്റുമായി സമാനമായിരിക്കുമെങ്കിലും അല്‍പ്പം കമ്പ്യൂട്ടര്‍ പ്രോഗ്രാമിങ്ങും മറ്റും കടന്നു വരാനുള്ള സാദ്ധ്യത ഇവിടെ ബിസിനസ്സ് അനലിസ്റ്റിനേക്കാള്‍ കൂടുതലാണ്. അതുകൊണ്ടു തന്നെ, ഡേറ്റ സയന്റിസ്റ്റിലേക്കുള്ള ചവിട്ടുപടിയായി ചിലര്‍ ഡേറ്റ അനലിസ്റ്റ് ജോലികളെ ഉപയോഗിക്കാറുണ്ട്. എന്നിരുന്നാലും, 'ബിസിനസ്സ് അനലിസ്റ്റ്', 'ഡേറ്റ അനലിസ്റ്റ്' എന്നീ നാമങ്ങള്‍ പലപ്പോഴും ഒരേ കാര്യത്തിന് പരസ്പരം ഇടകലര്‍ത്തി ഉപയോഗിക്കാറുണ്ട്. 

ഡാറ്റയുടെ ദൃശ്യാവിഷ്‌കാരത്തില്‍ താല്‍പ്പര്യമുള്ളവര്‍ക്ക് 'ബിസിനസ്സ് ഇന്റലിജന്‍സ്' എന്ന ഒരു ചെറിയ ഉപഭാഗവും ഇവിടെ കാണാം. കിട്ടുന്ന ഡേറ്റ പ്രോഗ്രാമിങ്ങിന്റെയോ സോഫ്റ്റ്‌വെയറുകളുടെയോ സഹായത്തോടെ വൃത്തിയാക്കി അതിനെ ദൃശ്യാവിഷ്‌കരിച്ചു അതില്‍ നിന്ന് മാതൃകകള്‍ മനസ്സിലാക്കുന്ന ജോലിയാണ് ഇവിടെ. ഒരു ഡാറ്റ അനലിസ്റ്റിനും ഒരു പരിധി വരെ ഇതൊക്കെ ചെയ്യേണ്ടി വന്നേക്കാമെങ്കിലും ഇതില്‍ത്തന്നെ അധിഷ്തിതമായ ബിസിനസ്സ് ഇന്റലിജന്‍സ് ജോലികള്‍ ദൃശ്യങ്ങളുണ്ടാക്കാന്‍ അഭിരുചിയുള്ളവര്‍ക്ക് യോജിച്ചതായിരിക്കും. 

ഇവയില്‍ നിന്നുള്ള അടുത്ത പടികളാണ് ഡാറ്റ  സയന്‍സിന്റെ കാതല്‍. ഇതുവരെ പറഞ്ഞവയ്ക്കു വേണ്ട വൈദഗ്ധ്യങ്ങള്‍ക്ക് പുറമെ, ഡാറ്റയെ ഗണിതശാസ്ത്രപരമായി ആവിഷ്‌കരിക്കാനും അതില്‍ നിന്ന് സങ്കീര്‍ണ്ണവും നൂതനവുമായ രീതികളിലൂടെ മാതൃകകള്‍ മനസ്സിലാക്കിയെടുക്കാനും ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സ് ഉണ്ടാക്കുവാനും താല്‍പര്യമുണ്ടെങ്കില്‍ പൊതുവെയുള്ള ഡാറ്റ സയന്റിസ്റ്റ് ജോലികള്‍ യോജിച്ചതാവാം. അതെ സമയം, മാതൃകകള്‍ മനസ്സിലാക്കി ഫലങ്ങള്‍ ആവിഷ്‌ക്കരിക്കുന്നതിനു പകരം ആവിഷ്‌ക്കരിച്ച ഫലങ്ങള്‍ കാര്യക്ഷമമായ രീതിയില്‍ ഉപഭോക്താക്കള്‍, അവര്‍ ജനങ്ങള്‍ ആയാലും മറ്റു ബസിനെസ്സുകള്‍ ആയാലും, അവരിലേക്കെത്തിക്കുന്നതിലാണ് താല്പര്യമെങ്കില്‍, 'മെഷീന്‍ ലേര്‍ണിംഗ് എഞ്ചിനീയര്‍', 'സോഫ്റ്റ്‌വെയര്‍ എഞ്ചിനീയര്‍ ഇന്‍ മെഷീന്‍ ലേര്‍ണിംഗ്' തുടങ്ങിയ അവസരങ്ങള്‍ ഉത്തമമാകാം.  

ഇവയല്ലാതെ ഉപഭോക്താവിന്റെ ആവശ്യങ്ങള്‍ മനസ്സിലാക്കി എന്ത് തരത്തിലുള്ള ഫലങ്ങള്‍ ആണ് ഏറ്റവും പ്രധാനം എന്നും ആവിഷ്‌ക്കരിക്കപ്പെട്ട ഫലങ്ങള്‍ എത്രത്തോളം ഉപയോഗപ്രദമാണെന്നും മനസ്സിലാക്കുന്നത് താല്‍പ്പര്യമുള്ളവര്‍ക്ക് ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്റലിജന്‍സുമായി ബന്ധപ്പെട്ട 'പ്രോഡക്റ്റ് മാനേജര്‍' അല്ലെങ്കില്‍ 'പ്രോഗ്രാം മാനേജര്‍' അവസരങ്ങള്‍ ഉചിതമാകാം. ഉദാഹരണത്തിന്, മൈക്രോസോഫ്റ്റില്‍ പല ടീമുകളിലും പ്രോഗ്രാം മാനേജര്‍,ഡാറ്റ  സയന്റിസ്റ്റ്, സോഫ്റ്റ്‌വെയര്‍ എഞ്ചിനീയര്‍ എന്നീ ജോലികള്‍ ചെയ്യുന്നവര്‍, സംയുകതമായാണ് പ്രൊജെക്ടുകള്‍ ചെയ്യാറ്. 

ഇവയ്‌ക്കൊക്കെ പുറമെ ഡാറ്റയില്‍ ഗവേഷണം നടത്താനാണ് ആഗ്രഹമെങ്കില്‍ ലോകമെമ്പാടുമുള്ള അനവധി സര്‍വ്വകലാശാലകളിലെ ലാബുകളില്‍ അവസരങ്ങള്‍ ലഭ്യമാണ്. പൊതുവെ, ഇന്നത്തെ ലോകത്തു കാണപ്പെടുന്ന പ്രധാന ഡേറ്റ അവസരങ്ങള്‍ ഇവയൊക്കെയാണെങ്കിലും മുന്‍പേ പറഞ്ഞത് പോലെ, ഓരോ സന്ദര്‍ഭവും നൂതനമായ ഒന്നായി കണ്ടു, അതിനെ താല്‍പ്പര്യങ്ങളുടെയും വൈദഗ്ദ്ധ്യത്തിന്റെയും കണ്ണിലൂടെ വിശദമായി വിശകലനം ചെയ്തതിനു ശേഷം മാത്രം തീരുമാനങ്ങളെടുക്കുക എന്നതാണ് ഏറ്റവും പ്രധാനമായ കാര്യം.

മൈക്രോസോഫ്റ്റില്‍ ഡാറ്റ സയന്റിസ്റ്റാണ് ലേഖകന്‍

Content Highlights: About Data science and its Future