本文轉自《Top Data Science Platforms in 2021 Other than Kaggle

內容為Google機器翻譯,比較粗糙,但不影響整體理解。

到2021年,現在的數據科學有所不同。

簡而言之,競爭更加激烈,需要不同的技巧來脫穎而出。在過去的5-10年中,數據科學吸引了來自世界各地的新移民來從事“ 21世紀最性感的工作”。

我最近在KDNuggets的一篇文章中閱讀了以下令人難以置信的統計數據,其中ML研究人員Mihail Eric分析了自2012年以來從Y-Combinator出來的每家公司所僱用的數據角色。

這是他在兩個句子中發現的要點。

圖片發布

數據科學相比,公司在數據工程領域的開放角色要多70%在培訓下一代數據和機器學習從業人員時,讓我們更加強調工程技能。

“這聽起來可能很無聊而且不那麼性感,但是偏向於數據的老式軟件工程也許是我們現在真正需要的。”

那麼這是否意味着您不應該學習數據科學?不,這意味着競爭將更加激烈。對於正在接受訓練有素的數據科學市場的新手來說,將會有越來越少的職位可用。

熱門AI文章:

1.帶有資源的前5個開源機器學習推薦系統項目

2.無人駕駛汽車的深度學習

3.機器學習模型的泛化技術

4.為什麼要放棄內部培訓數據工具(並避免自己構建)

要脫穎而出,您需要動手並建立真正重要的技能。這不僅意味着技術技能,還意味着協作,領導能力和解決問題的能力。

為了到達那裡,我想與您分享一些平台,這些平台都強調不同的技能和知識,以使您為現實世界做好準備。

本文分為兩個部分:

  1. 競爭和協作平台可磨練您的技能
  2. 增強特定技能的新資源

儘管Kaggle數據科學競賽的知名平台,但還有許多值得了解和探索的平台,如果您有興趣獲得工作中所需的技能,則值得一試。

Driven Data

圖片發布
https://www.drivendata.org/

DrivenData在國際發展,衛生,教育,研究和保護以及公共服務等領域的數據科學與社會影響相交的項目上開展工作。他們的使命是使更多的組織能夠使用數據科學的能力,並使更多的數據科學家面臨社會挑戰,他們的技能可能會有所作為。

該站點有一個專門介紹比賽的部分。驅動數據中列出的數據集與從野生生物保護到公共衛生的非營利性相關。因此,如果您想運用自己的技能來解決有意義的問題,則驅動數據可以成為弄髒手的地方。

Omdena

圖片發布
圖片發布
https://omdena.com/projects

Omdena是一個協作平台,而不是一個競爭性平台,它託管着兩個月的項目,從問題範圍界定到數據收集,預處理以及ML建模和部署。我們的使命是幫助組織(初創企業,非政府組織,社會企業)建立現實解決方案,同時幫助來自世界各地的數據科學家和工程師產生影響,建立21世紀的技能並在全球社區中建立網絡。

在Omdena項目中,您將加入一個由多達50名來自不同背景的協作者組成的協作團隊。項目範圍從屋頂的太陽能檢測,檢測物品的偏斜,預防瘧疾感染到幾個商業型影響項目。如果您想獲得全面的真實體驗,Omdena可能是您的理想平台。

CrowdANALYTIX

圖片發布
https://www.crowdanalytix.com/community

CrowdANALYTIX將業務挑戰轉化為分析競賽;並解決了對需要預測分析,描述性分析,估計和業務假設驗證的分析解決方案的需求。

該平台還託管一個社區博客,該博客具有出色的資源,包括訪談和參考資料。如果您正在尋找面向業務的項目,那麼這可能就是您的平台。

Datacamp

圖片發布
https://learn.datacamp.com/projects

Datacamp提供了一種對初學者友好的解決實際問題的方法

Datacamp的方法是樹立自己編寫代碼的信心。通過項目,您可以使用Jupyter Notebook之類的工具來應用技能,並從頭到尾完成數據分析-所有這些都在無風險的環境中進行。

您可以運用您的編碼技能來解決開放式問題,而無需執行分步任務。如果您陷入困境,請跟隨實時代碼以及視頻,以了解我們的專家講師如何找到許多可能的解決方案之一。

Innocentive

圖片發布
https://www.innocentive.com/our-solvers/

InnoCentive是一家開放式創新眾包公司,主要關注與生命科學有關的問題。

人群可以是外部的(即,他們的超過380,000個問題解決者的網絡),也可以是內部的(即,組織的員工,合作夥伴或客戶)。對於符合“挑戰”說明中列出的要求的提交,通常會授予獎勵。挑戰的平均獎勵金額為20,000美元,但有些提供的獎勵超過100,000美元。

作為解決者,您可以為解決世界上最緊迫的問題做出貢獻。

Codalab

圖片發布
https://codalab.org/

Codalab是一個基於Web的開放源代碼平台,使研究人員,開發人員和數據科學家能夠協作以推進使用機器學習和高級計算的研究領域。CodaLab通過其在線社區幫助解決面向數據的研究中的許多常見問題,人們可以在其中共享工作表並參加比賽。

然後,其他協作者可以輕鬆地複製,修改和編輯實驗,以推進數據驅動研究和機器學習的最新技術。

ZINDI

圖片發布
https://zindi.africa/competitions

Zindi是一個數據科學競賽平台,其使命是在非洲建立數據科學生態系統。他們將組織與我們蓬勃發展的非洲數據科學界聯繫起來,以使用機器學習和AI解決全球最緊迫的挑戰。

Analytics Vidhya

圖片發布
https://datahack.analyticsvidhya.com/

競爭,贏得,練習,學習和建立您的數據科學產品組合的數據科學競賽!

Analytics Vidhya 為Analytics(分析)和Data Science專業人員提供了一個基於社區的知識門戶。除了為數據科學學習提供大量資源外,它還舉辦Hackathons,這是競賽形式發布的現實生活中的行業問題。您可以參加挑戰賽或贊助黑客馬拉松。大多數在Analytics(分析)Vidhya上組織Hackathons的公司還為得分最高的人提供工作機會。

AIcrowd

圖片發布
https://www.aicrowd.com/

數據科學挑戰平台AIcrowd每年都會舉辦多個開放數據科學挑戰。挑戰包括圖像分類問題,文本識別,強化學習,對抗攻擊,圖像分割,資源分配優化以及跨多個域的許多其他領域。他們因其2017年的“學習跑步”挑戰而從亞馬遜和Nvidia獲得了超過100,000美元的獎勵。

Hackathons

HackerEarth

圖片發布
https://www.hackerearth.com/

Hackerrank是#初學者的好地方。在這裡,來自世界各地的程序員聚在一起解決廣泛的計算機科學領域的問題,例如算法,機器學習或人工智能,並實踐諸如函數式編程之類的不同編程範例。

Machinehack

圖片發布
https://www.machinehack.com/

MachineHack是機器學習競賽的在線平台。

它是一個不斷發展的平台,其使命是支持不斷增長的數據科學界,並幫助年輕有抱負的人學習和提高他們在分析領域的技能。他們面臨著棘手的業務問題,現在可以在機器學習和數據科學中找到解決方案。

新資源

頂尖大學提供的免費ML大學課程(更新於2021年)

從斯坦福大學(吳安德和其他人)到暑期學校,全部可用,更新或存檔。

  • 麻省理工學院
  • 斯坦福大學(吳安德(Andrew Ng)等
  • 伯克利大學
  • 卡內基·梅隆大學
  • 等等。

在這裡找到所有課程。