easyai.tech 發現入門人工智慧是一件很難的事情,尤其是對於非技術人員。
於是我們將國內外優秀的科普內容用最通俗易懂的方式整合到一起,專門針對非技術人員,讓大家都能理解人工智慧領域裡的基本概念。
先通過一張長圖來講解一下 PDF 中會涉及到的主要內容,如果想了解詳情請下載 PDF。
讓非技術也能理解 NLP
本篇內容則是 NLP 的專題,我們匯總了一些關於 NLP 的基礎內容,相信大家看完這個 PDF 後可以理解下面幾個問題:
- NLP 是什麼,為什麼大家要研究 NLP ?
- 研究和應用 NLP 的目的是什麼?
- NLP 在實際應用中會用到哪些方法,大概有哪些步驟?
由於是針對非技術人群的,所以內容里不會涉及到代碼或者大量的技術概念,不需要有技術基礎同樣可以看明白。
PDF 里的內容結構
上圖是 PDF 里涉及到的主要內容,下面給大家講解一下:
自然語言處理 – NLP
NLP 就是人類和機器之間溝通的橋樑!這個部分會講解 NLP 的重要性,研究 NLP 的目的,NLP 的應用方向,NLP 的大致方法和流程等內容,讓大家對 NLP 有一個宏觀的認識。
了解詳情:《一文看懂自然語言處理-NLP(4個典型應用+5個難點+6個實現步驟)》
自然語言理解 – NLU
自然語言理解就是希望機器像人一樣,具備正常人的語言理解能力,由於自然語言在理解上有很多難點(下面詳細說明),所以 NLU 是至今還遠不如人類的表現。
了解詳情:《一文看懂自然語言理解-NLU(基本概念+實際應用+3種實現方式)》
自然語言生成 – NLG
NLG 是為了跨越人類和機器之間的溝通鴻溝,將非語言格式的數據轉換成人類可以理解的語言格式,如文章、報告等。
了解詳情:《一文看懂自然語言生成 – NLG(6個實現步驟+3個典型應用)》
分詞 – Tokenization
分詞是自然語言理解 – NLP 的重要步驟。分詞就是將句子、段落、文章這種長文本,分解為以字詞為單位的數據結構,方便後續的處理分析工作。
了解詳情:《一文看懂NLP里的分詞-Tokenization(中英文區別+3大難點+3種典型方法)》
詞幹提取 – Stemming | 詞形還原 – Lemmatisation
詞幹提取和詞形還原是英文語料預處理中的重要環節。雖然他們的目的一致,但是兩者還是存在一些差異。本文將介紹他們的概念、異同、實現演算法等。
了解詳情:《一文看懂詞幹提取-Stemming和詞形還原-Lemmatisation(概念、異同、演算法)》
詞性標註 – Part of speech
本文根據自己的學習過程以及查閱相關資料的理解,對自然語言基礎技術之詞性標註進行了相對全面的簡紹,包括定義、目前的難點以及常見方法,還推薦了一大波python實戰利器,並且包括工具的用法。
了解詳情:《一文看懂詞性標註(基本概念+4種方法+7種工具)》
命名實體識別 – Named-entity recognition | NER
命名實體識別(Named Entity Recognition,簡稱NER),又稱作「專名識別」,是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等。簡單的講,就是識別自然文本中的實體指稱的邊界和類別。
了解詳情:《一文看懂命名實體識別 – NER(發展史+4類方式+數據集+工具推薦)》
上面的所有內容都整理成了59頁的PDF《非技術也能看懂的 NLP 入門科普》,點擊下方按鈕進行下載。
如果上面的圖片顯示有問題,請點擊這裡下載:下載鏈接
5 Comments
請問為什麼只有語料預處理的介紹,後面的步驟就沒有了呢?
後面還沒有完善
請問為什麼只有語料預處理的介紹,後面的步驟就沒有了呢?
後面的內容還沒有完善
網盤失效了,能補一下嗎,謝謝