新聞中心
從頭開始學(xué)習(xí)數(shù)據(jù)科學(xué)的免費(fèi)資源。

陸河ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場(chǎng)景,ssl證書未來市場(chǎng)廣闊!成為創(chuàng)新互聯(lián)的ssl證書銷售渠道,可以享受市場(chǎng)價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:18980820575(備注:SSL證書合作)期待與您的合作!
如何入門數(shù)據(jù)科學(xué)?
這個(gè) GitHub 項(xiàng)目提供了一份免費(fèi)學(xué)習(xí)資源,既包括超詳細(xì)的學(xué)習(xí)路線圖,又涵蓋多個(gè)免費(fèi)線上課程、大量數(shù)據(jù)科學(xué)項(xiàng)目和 100 多本免費(fèi)機(jī)器學(xué)習(xí)書籍,項(xiàng)目上線數(shù)天即獲得 2.4k 星。
項(xiàng)目地址:https://github.com/therealsreehari/Learn-Datascience-for-Free#5_-expressions
該項(xiàng)目收集了散布在網(wǎng)絡(luò)上的不同資源,并按照一定的順序進(jìn)行組合,以幫助數(shù)據(jù)科學(xué)初學(xué)者解決如何搜索免費(fèi)和結(jié)構(gòu)化學(xué)習(xí)資源的問題。項(xiàng)目作者表示,該項(xiàng)目將基于新的免費(fèi)資源持續(xù)更新。
數(shù)據(jù)科學(xué)家學(xué)習(xí)路線圖
「磨刀不誤砍柴工?!乖擁?xiàng)目首先詳細(xì)介紹了一份數(shù)據(jù)科學(xué)路線圖,羅列了數(shù)據(jù)科學(xué)學(xué)習(xí)者需要掌握的內(nèi)容:
基礎(chǔ)知識(shí)(矩陣和代數(shù)基礎(chǔ)等);
統(tǒng)計(jì)學(xué)(概率論、貝葉斯定理等);
編程;
機(jī)器學(xué)習(xí);
文本挖掘 / 自然語言處理;
數(shù)據(jù)可視化;
大數(shù)據(jù);
數(shù)據(jù)獲??;
數(shù)據(jù)再加工(Data Munging);
工具箱。
成為數(shù)據(jù)科學(xué)家需要掌握的基礎(chǔ)知識(shí)
在成為數(shù)據(jù)科學(xué)家之前,你需要掌握關(guān)于矩陣的理論知識(shí),了解其操作方式,熟悉矩陣的各種變換。項(xiàng)目作者還向我們介紹了多種數(shù)據(jù)結(jié)構(gòu),包括哈希函數(shù)、二叉樹等。
以二叉樹為例,項(xiàng)目作者解釋了什么是二叉樹:「在計(jì)算機(jī)科學(xué)中,二叉樹是一種樹數(shù)據(jù)結(jié)構(gòu),其中每個(gè)節(jié)點(diǎn)最多具有兩個(gè)子節(jié)點(diǎn),稱為左子節(jié)點(diǎn)和右子節(jié)點(diǎn)?!?/p>
二叉樹
除了矩陣知識(shí)以外,數(shù)據(jù)科學(xué)初學(xué)者還需掌握關(guān)系代數(shù)、數(shù)據(jù)庫基礎(chǔ)知識(shí)、CAP 原理、ETL 等多達(dá)十多個(gè)知識(shí)點(diǎn)(有些部分還在更新中)。
統(tǒng)計(jì)學(xué)
該項(xiàng)目介紹了許多關(guān)于統(tǒng)計(jì)學(xué)的知識(shí),包括數(shù)據(jù)集的選擇、描述性統(tǒng)計(jì)、探索性數(shù)據(jù)分析、直方圖、概率論、貝葉斯定理等內(nèi)容。
以探索性數(shù)據(jù)分析為例,項(xiàng)目作者從數(shù)據(jù)的可視化和分析兩方面著手,向我們介紹了完成整個(gè)數(shù)據(jù)分析任務(wù)需要的開發(fā)環(huán)境、依賴庫、安裝方式以及分析方式。
點(diǎn)擊 Seaborn 鏈接,可進(jìn)入 Seaborn 主頁,該圖為鏈接到的主頁內(nèi)容。
在數(shù)據(jù)分析方面,項(xiàng)目作者介紹了 PCA 降維方法,幫助學(xué)習(xí)者了解什么是主成分分析,以及如何在 Python 中實(shí)現(xiàn)。
編程
成為數(shù)據(jù)科學(xué)家離不開編程,該項(xiàng)目介紹了需要掌握的編程語言 Python、R setup/R studio 等內(nèi)容。以 R setup / R studio 為例,項(xiàng)目作者介紹了兩種安裝方式 Linux、Windows。但是本部分內(nèi)容還有許多待補(bǔ)充知識(shí)。
待補(bǔ)充內(nèi)容
機(jī)器學(xué)習(xí)
該項(xiàng)目還列舉了掌握數(shù)據(jù)科學(xué)需要了解的機(jī)器學(xué)習(xí)知識(shí),包括數(shù)值變量、分類變量、監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、訓(xùn)練集和測(cè)試集、分類器、過擬合、偏差和方差、支持向量機(jī)等 30 項(xiàng)內(nèi)容。
以支持向量機(jī)為例,項(xiàng)目作者首先介紹了支持向量機(jī)的作用——可用于分類和回歸任務(wù),接著用簡(jiǎn)單明了的語言解釋了支持向量機(jī)的原理。此外,項(xiàng)目作者還列舉了關(guān)于支持向量機(jī)的其他知識(shí),讀者可通過鏈接自行學(xué)習(xí)。
支持向量機(jī)
除了上述介紹的內(nèi)容外,項(xiàng)目作者還整理了文本挖掘、數(shù)據(jù)可視化等內(nèi)容,此處不再贅述。
免費(fèi)線上課程
該項(xiàng)目基于 GitHub 用戶 Developer-Y 的項(xiàng)目整理了大量線上免費(fèi)課程的資源,包括人工智能、機(jī)器學(xué)習(xí)、機(jī)器人學(xué)三個(gè)主要部分。其中機(jī)器學(xué)習(xí)部分又細(xì)分為機(jī)器學(xué)習(xí)導(dǎo)論、數(shù)據(jù)挖掘、數(shù)據(jù)科學(xué)、概率圖模型、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、進(jìn)階版機(jī)器學(xué)習(xí)課程、基于機(jī)器學(xué)習(xí)的自然語言處理與計(jì)算機(jī)視覺、時(shí)序分析、概率與統(tǒng)計(jì)學(xué)、線性代數(shù)等。
該項(xiàng)目提供的免費(fèi)線上課程列表部分截圖。
從該項(xiàng)目列表中,我們可以看到熟悉的吳恩達(dá)機(jī)器學(xué)習(xí)課程,以及來自卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、加州大學(xué)伯克利分校、微軟等機(jī)構(gòu)的豐富課程資源。
人工智能開源項(xiàng)目
此外,該項(xiàng)目還羅列了大量人工智能開源項(xiàng)目,涵蓋機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺這些領(lǐng)域。
這一資源來自 AI 研究者、數(shù)據(jù)科學(xué)家 Ashish Patel 創(chuàng)建的 GitHub 庫,目前包含 71 個(gè)條目,點(diǎn)開鏈接即可獲取相應(yīng)的項(xiàng)目和代碼資源。
項(xiàng)目列表部分截圖。
從目前的列表中,我們可以看到它包括目標(biāo)檢測(cè)、聊天機(jī)器人、GUI、無監(jiān)督學(xué)習(xí)、回歸分析、情感分析、推薦系統(tǒng)、數(shù)據(jù)科學(xué)、NLP、計(jì)算機(jī)視覺等細(xì)分領(lǐng)域的相關(guān)項(xiàng)目資源。蓋列表將持續(xù)更新。
100+ 免費(fèi)機(jī)器學(xué)習(xí)書籍
項(xiàng)目作者整理了一份來自 Insane 的機(jī)器學(xué)習(xí)書籍列表文章。該列表在 2021 年 1 月份剛剛更新過,包括我們熟悉的「花書」《深度學(xué)習(xí)》,以及主題為圖算法、自然語言處理、數(shù)據(jù)挖掘、GAN、Python 等的書籍。
圖源:https://www.theinsaneapp.com/2020/12/download-free-machine-learning-books.html
項(xiàng)目作者表示,希望這些免費(fèi)資源能夠幫助到無法支付教育費(fèi)用的人們,從頭開始掌握數(shù)據(jù)科學(xué)。
本文標(biāo)題:這個(gè)GitHub項(xiàng)目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)
轉(zhuǎn)載來源:http://fisionsoft.com.cn/article/djejpch.html


咨詢
建站咨詢
