Data science neboli datová věda je interdisciplinární obor, který využívá vědecké metody, procesy, algoritmy a systémy pro získávání znalostí a poznatků z dat v různých podobách, jak strukturovaných, tak nestrukturovaných[1][2] podobně jako data mining.
Data science „sjednocuje statistiku, analýzu dat, strojové učení a související metody“ s cílem „pochopit a analyzovat skutečné jevy“ na základě dat.[3] Využívá techniky a teorie čerpané z mnoha oblastí matematiky, statistiky, informatiky a matematické informatiky.
Nositel Turingovy ceny Jim Gray si data science představoval jako „čtvrté paradigma“ vědy (empirické, teoretické, výpočetní a nyní založené na datech) a tvrdil, že „všechno ve vědě se mění v důsledku vlivu informačních technologií“ a záplavy dat.[4][5]
V roce 2012, kdy Harvard Business Review nazval data science „nejvíce sexy zaměstnáním 21. století“[6] se tento termín stal módním slovem. To je nyní často používáno zaměnitelně se staršími pojmy jako business analytics,[7] business intelligence, prediktivní modelování, data mining a statistika. Dokonce i myšlenka, že datová věda je sexy, parafrázuje Hanse Roslinga, který v dokumentu BBC 2011[8] prohlásil: „Statistika je nyní nejvíce sexy téma, které tu máme.“[9] Nate Silver označil datovou vědu za sexy termín pro statistiku.[10] V mnoha případech jsou nyní dřívější přístupy a řešení jednoduše přejmenovávány jako data science, aby byly atraktivnější, což může způsobit, že termín se „zředí […] za hranici užitečnosti“.[11] I když mnohé univerzitní programy nyní nabízejí titul v oboru datové vědy, neexistuje konsensus o její definici nebo o obsahu učebních osnov.[7] K diskreditaci data science přispívá mnoho projektů v oblasti datové vědy a velkých dat, které nedokázaly poskytnout užitečné výsledky, často v důsledku špatného řízení a využívání zdrojů.[12][13][14][15]
- ↑ DHAR, V. Data science and prediction. Communications of the ACM. 2013, s. 64. Dostupné online. doi:10.1145/2500499. Je zde použita šablona
{{Cite journal}}
označená jako k „pouze dočasnému použití“.
- ↑ Archivovaná kopie [online]. [cit. 2019-01-17]. Dostupné v archivu pořízeném dne 2014-01-02.
- ↑ [s.l.]: [s.n.] Dostupné online. ISBN 9784431702085. doi:10.1007/978-4-431-65950-1_3.
- ↑ Stewart Tansley; KRISTIN MICHELE TOLLE. The Fourth Paradigm: Data-intensive Scientific Discovery. [s.l.]: Microsoft Research, 2009. Dostupné online. ISBN 978-0-9825442-0-4. Je zde použita šablona
{{Cite book}}
označená jako k „pouze dočasnému použití“.
- ↑ BELL, G.; HEY, T.; SZALAY, A. COMPUTER SCIENCE: Beyond the Data Deluge. Science. 2009, s. 1297–1298. ISSN 0036-8075. doi:10.1126/science.1170411. Je zde použita šablona
{{Cite journal}}
označená jako k „pouze dočasnému použití“.
- ↑ DAVENPORT, Thomas H.; PATIL, DJ. Data Scientist: The Sexiest Job of the 21st Century. [s.l.]: Harvard Business Review, Oct 2012. Dostupné online. Je zde použita šablona
{{Citation}}
označená jako k „pouze dočasnému použití“.
- ↑ a b Data Science: What's The Half-Life Of A Buzzword? [online]. [cit. 2022-04-16]. Dostupné online.
- ↑ BBC Four - The Joy of Stats. BBC [online]. [cit. 2022-04-16]. Dostupné online. (anglicky)
- ↑ SINGER, Natasha. When the Data Struts Its Stuff. www.nytimes.com. 2011-04-02. Dostupné online [cit. 2018-09-01]. (anglicky) Je zde použita šablona
{{Cite news}}
označená jako k „pouze dočasnému použití“.
- ↑ Archivovaná kopie [online]. [cit. 2019-01-17]. Dostupné v archivu.
- ↑ Archivovaná kopie. radar.oreilly.com. Dostupné v archivu pořízeném dne 2019-02-01.
- ↑ REDMAN, Thomas C. Are You Setting Your Data Scientists Up to Fail?. Harvard Business Review. 2018-01-25. Dostupné online [cit. 2022-04-16]. ISSN 0017-8012.
- ↑ 70% of Big Data projects in UK fail to realise full potential. www.consultancy.uk [online]. 2018-04-30 [cit. 2022-04-16]. Dostupné online. (anglicky)
- ↑ The Data Economy: Why do so many analytics projects fail? – Analytics Magazine. Analytics Magazine. 2014-07-07. Dostupné online [cit. 2018-05-26]. (anglicky) Je zde použita šablona
{{Cite news}}
označená jako k „pouze dočasnému použití“.
- ↑ Data Science: 4 Reasons Why Most Are Failing to Deliver [online]. [cit. 2022-04-16]. Dostupné online. (anglicky) [nedostupný zdroj]