Liste over 10 bedste datavidenskabelige bøger og beskrivelser til generalisten

Liste Over 10 Bedste Datavidenskabelige Boger Og Beskrivelser Til Generalisten



Data Science er studieretningen, der håndterer enorme mængder data ved hjælp af videnskabelige metoder, processer, algoritmer og systemer til at finde de usete mønstre, udlede meningsfuld information, træffe forretningsbeslutninger i virksomheder og også bruge i ikke-erhvervsmæssige institutioner. De ikke-erhvervsmæssige institutioner omfatter industrier for sundhedspleje, spil, billedgenkendelse, anbefalingssystemer, logistik, svindeldetektion (bank- og finansielle institutioner), internetsøgning, talegenkendelse, målrettet annoncering, flyruteplanlægning og augmented reality. Data Science er en undergruppe af kunstig intelligens. De data, der bruges til analyse, kan komme fra mange forskellige kilder og præsenteres i forskellige formater. Nogle af kildedataene kan være standardiserede; andre er muligvis ikke standardiserede.

For at sige det på en anden måde, bruges forskellige metoder til at indsamle dataene (flertal af datum). Derefter udvindes viden (værdifulde konklusioner) fra de samlede data. I processen, efter at dataene er indsamlet, forskes der i dem (data) for at opnå nye data (resultater), hvorfra problemerne løses.







Data Science som (hoved)disciplin findes på bachelor- og kandidatniveau på universitetet. Det er dog kun få universiteter i verden, der tilbyder Data Science på bachelor- eller kandidatgraden. På bachelorniveau dimitterer den studerende med en uddannelse i Data Science. Dette er ligesom en generel grad. På kandidatgradsniveau forlader den studerende med en postgraduate-grad i datavidenskab med speciale i dataanalyse, datateknik eller som dataforsker.



Det kan overraske læseren og muligvis desværre, at Machine Learning, Modellering, Statistik, Programmering og Databaser er en forudsætning for at kunne studere Data Science på bachelorniveau på trods af, at de er respekterede universitetskurser i deres egen ret, studeret i andre discipliner på bachelor- eller kandidatniveau. Uanset, når en studerende går på et universitet for at studere Data Science på gradsniveau, vil alle disse kurser stadig blive studeret, sideløbende med eller før de rigtige kurser, for Data Science.



Data Science til bachelorgrad eller dets specialiseringer som Data Analytics, Data Engineering eller som Data Scientist er stadig under udvikling; selvom de nåede et stadie, hvor de anvendes i industrien efter at have været studeret (på universitetet). Data Science er generelt en relativt ny disciplin.





Husk, at du først skal være generalist, før du bliver specialist. Forskellene mellem specialistprogrammer er endnu ikke klare. Forskellene mellem generalist- og specialistuddannelserne er endnu ikke klare.

Da Data Science er en relativt ny disciplin, er de bøger, der er foreskrevet i dette dokument, baseret på indholdsdækning og ikke pædagogik (hvor godt bogen underviser). Og de er til bacheloruddannelsen (generalist). Der er forskellige generalistkurser.



Listen

For flere detaljer og eventuelt køb med kreditkort gives et hyperlink til hver af bøgerne. Ikke én af bøgerne dækker alle generalistkurserne.

Essential Math for Data Science: Calculus, Statistik, Sandsynlighedsteori og Lineær Algebra

Skrevet af: Hadrien Jean

  • Forlag: Hadrien Jean
  • Udgivet dato: Efter 30. september 2020
  • Sprog: Engelsk
  • Antal sider: ‎mere end 400

Indholdet af denne bog kan ses som matematikkurset for Data Science. Selvom det ikke anbefales at lære Data Science alene, bør en gymnasial kandidat, der ønsker at lære Data Science på egen hånd, starte med denne bog.

Indhold: Calculus; Statistik og Sandsynlighed; Lineær algebra; Skalarer og vektorer; Matricer og Tensorer; Spændvidde, lineær afhængighed og rumtransformation; Systemer af lineære ligninger; egenvektorer og egenværdier; Enkeltværdinedbrydning.

https://www.essentialmathfordatascience.com/

En sund fornuftsvejledning til datastrukturer og algoritmer: Udvid dine kerneprogrammeringsfærdigheder / 2. udgave

Skrevet af: Jay Wengrow

  • Forlag: Pragmatic Bookshelf
  • Udgivet dato: 15. september 2020
  • Sprog: Engelsk
  • Dimensioner: 7,5 x 1,25 x 9,25 tommer
  • Antal sider: ‎508

Denne bog omhandler algoritmer og datastrukturer, som bruges i Data Science. Hvis man antager, at nogen selv lærer Data Science efter at have afsluttet gymnasiet, så er dette den næste bog, man skal læse efter at have læst den forrige matematikbog. Eksempelprogrammerne er givet i JavaScript, Python og Ruby.

Indhold: Hvorfor datastrukturer betyder noget; Hvorfor algoritmer betyder noget; Åh ja! Big O-notation; Fremskynd din kode med Big O; Optimering af kode med og uden Big O; Optimering til optimistiske scenarier; Big O i hverdagskode; Lynhurtigt opslag med hash-tabeller; Udarbejdelse af elegant kode med stakke og køer; Rekursivt recursion med rekursion; Lære at skrive rekursivt; Dynamisk programmering; Rekursive algoritmer for hastighed; Node-baserede datastrukturer; Fremskynde alle tingene med binære søgetræer; Hold dine prioriteter lige med dynger; Det gør ikke ondt at prøve; At forbinde alt med grafer; Håndtering af pladsbegrænsninger; Teknikker til kodeoptimering

Smarter Data Science: Succes med Enterprise-Grade Data og AI-projekter / 1 st Redigering

Skrevet af: Neal Fishman, Cole Stryker og Grady Booch

  • Forlag: Wiley
  • Udgivet dato: 14. april 2020
  • Sprog: Engelsk
  • Antal sider: ‎286

Indhold: Klatring af AI-stigen; Framing del I: Overvejelser for organisationer, der bruger AI; Framing del II: Overvejelser for at arbejde med data og AI; Et tilbageblik på Analytics: Mere end én hammer; Et kig fremad på Analytics: Ikke alt kan være et søm; Håndtering af operationelle discipliner på AI-stigen; Maksimering af brugen af ​​dine data: Værdidrevet; Værdsættelse af data med statistisk analyse og muliggør meningsfuld adgang; Konstruktion på lang sigt; A Journey's End: En IA for AI.

Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning-serien) Illustreret udgave

Skrevet af: Kevin P. Murphy

  • Udgiver: The MIT Press
  • Udgivet dato: 24. august 2012
  • Sprog: Engelsk
  • Dimensioner: 8,25 x 1,79 x 9,27 tommer
  • Antal sider: ‎1104

Denne bog er god til begyndere. Igen, ligesom alle de øvrige bøger, der er foreskrevet i dette dokument, dækker denne bog ikke alt, hvad der er nødvendigt for generalistuddannelsen, som desværre stadig ikke er afsluttet (specialistuddannelserne er heller ikke afsluttet). Den typiske nybegynder her er en gymnasial kandidat med bestået matematik og datalogi.

Indhold: Introduktion (Machine learning: what and why?, Unsupervised learning, Nogle grundlæggende begreber i machine learning); Sandsynlighed; Generative modeller for diskrete data; Gaussiske modeller; Bayesiansk statistik; Frekventistiske statistikker; Lineær regression; Logistisk regression; Generaliserede lineære modeller og den eksponentielle familie; Styrede grafiske modeller (Bayes-net); Blandingsmodeller og EM-algoritmen; Latente lineære modeller; Sparsomme lineære modeller; Kerner; Gaussiske processer; Adaptive basisfunktionsmodeller; Markov og skjulte Markov modeller; Statlige rum modeller; Urettede grafiske modeller (Markov tilfældige felter); Præcis slutning for grafiske modeller; Variationel inferens; Mere variationsmæssig slutning; Monte Carlo slutning; Markov-kæden Monte Carlo (MCMC) slutning; Klynger; Læring af grafisk modelstruktur; Latente variable modeller for diskrete data; Dyb læring.

Data Science for Business: Hvad du behøver at vide om datamining og dataanalytisk tænkning / 1. udgave

Skrevet af: Tom Fawcett og Foster Provost

  • Udgiver: O'Reilly Media
  • Udgivet dato: 17. september 2013
  • Sprog: Engelsk
  • Dimensioner: 7 x 0,9 x 9,19 tommer
  • Antal sider: ‎413

Indhold: Data-analytisk tænkning; Forretningsproblemer og datavidenskabelige løsninger; Introduktion til prædiktiv modellering: Fra korrelation til overvåget segmentering; Tilpasning af en model til data; Overfitting og dens undgåelse; lighed, naboer og klynger; Beslutningsanalytisk tænkning I: Hvad er en god model?; Visualisering af modelydelse; Beviser og sandsynligheder; Repræsentere og udvinde tekst; Beslutningsanalytisk tænkning II: Mod analytisk teknik; Andre datavidenskabelige opgaver og teknikker; Datavidenskab og forretningsstrategi; Konklusion.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktisk statistik for dataforskere: 50+ væsentlige begreber ved hjælp af R og Python / 2. udgave

Skrevet af: Peter Bruce, Andrew Bruce og Peter Gedeck

  • Udgiver: O'Reilly Media
  • Udgivet dato: 2. juni 2020
  • Sprog: Engelsk
  • Dimensioner: 7 x 0,9 x 9,1 tommer
  • Antal sider: ‎368

Indhold: Eksplorativ dataanalyse, data- og stikprøvefordelinger, statistiske eksperimenter og signifikanstestning, regression og forudsigelse, klassifikation, statistisk maskinindlæring, uovervåget læring.

Bogen om hvorfor: Den nye videnskab om årsag og virkning

Skrevet af: Judea Pearl, Dana Mackenzie

  • Forlag: Grundbog
  • Udgivet dato: 15. maj 2018
  • Sprog: Engelsk
  • Dimensioner: 6,3 x 1,4 x 9,4 tommer
  • Antal sider: ‎432

Mens mange Data Science-bøger bruger den rene forretningsindustri til illustration, bruger denne bog medicinindustrien og andre discipliner til illustration.

Indhold: Introduktion: Mind over Data; Årsagsstigen; Fra Buccaneers til marsvin: The Genesis of Causal Inference; Fra beviser til årsager: pastor Bayes møder hr. Holmes; Confounding og Deconfounding: Eller, dræbe den lurende variabel; Den røgfyldte debat: At rense luften; Paradokser i massevis!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafakta: Mineverdener, der kunne have været; Mediation: Søgen efter en mekanisme; Big Data, kunstig intelligens og de store spørgsmål.

Byg en karriere inden for datavidenskab

Skrevet af: Emily Robinson og Jacqueline Nolis

  • Forlag: Manning
  • Udgivet dato: 24. marts 2020
  • Sprog: Engelsk
  • Dimensioner: 7,38 x 0,8 x 9,25 tommer
  • Antal sider: ‎354

Indhold: Kom godt i gang med datavidenskab; Find dit Data Science job; At sætte sig ind i datavidenskab; Vokser i din Data Science-rolle.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2. udgave

Skrevet af: Lillian Pierson

  • Forlag: For Dummies
  • Udgivet dato: 6. marts 2017
  • Sprog: Engelsk
  • Dimensioner: 7,3 x 1 x 9 tommer
  • Antal sider: ‎384

Denne bog antager, at læseren allerede har den nødvendige viden om matematik og programmering.

Indhold:  Indpakning af datavidenskab; Udforskning af dataingeniørrørledninger og -infrastruktur; Anvendelse af datadrevet indsigt til erhvervslivet og industrien; Machine Learning: Lær af data med din maskine; Matematik, sandsynlighed og statistisk modellering; Brug af clustering til at underinddele data; Modellering med instanser; Opbygning af modeller, der driver Internet-of-Things-enheder; Følger principperne for datavisualiseringsdesign; Brug af D3.js til datavisualisering; Web-baserede applikationer til visualiseringsdesign; Udforskning af bedste praksis inden for dashboarddesign; Oprettelse af kort fra geografiske data; Brug af Python til datavidenskab; Brug af Open Source R til Data Science; Brug af SQL i Data Science; At lave datavidenskab med Excel og Knime; Data Science in Journalism: Nailing Down the Five W'er (og et H); Fordybelse i miljødatavidenskab; Data Science for Driving Growth in E-Commerce; Brug af datavidenskab til at beskrive og forudsige kriminel aktivitet; Ti fænomenale ressourcer til åbne data; Ti gratis datavidenskabelige værktøjer og applikationer.

Udvinding af massive datasæt / 3 rd Redigering

Skrevet af: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Udgiver: Cambridge University Press
  • Udgivet dato: 13. februar 2020
  • Sprog: Engelsk
  • Dimensioner: 7 x 1 x 9,75 tommer
  • Antal sider: ‎565

Denne bog forudsætter også, at læseren allerede har den nødvendige viden om matematik og programmering.

Indhold: Data Mining; MapReduce og den nye softwarestak; Algoritmer, der bruger MapReduce; Finde lignende genstande; Minedatastrømme; Link Analyse; Hyppige varesæt; Klynger; Annoncering på nettet; Anbefalingssystemer; Mining Social-Network Grafer; Dimensionalitetsreduktion; Maskinlæring i stor skala.

Konklusion

Forskellene mellem specialistprogrammer er endnu ikke klare. Sondringen mellem generalist- og specialistuddannelserne er heller ikke klar endnu. Men efter at have læst den givne liste over bøger, vil læseren være i stand til bedre at værdsætte de særlige roller som dataanalytiker, dataingeniør og dataforsker og derefter komme videre.