easyai.tech 發現入門人工智能是一件很難的事情,尤其是對於非技術人員。

於是我們將國內外優秀的科普內容用最通俗易懂的方式整合到一起,專門針對非技術人員,讓大家都能理解人工智能領域裡的基本概念。

先通過一張長圖來講解一下 PDF 中會涉及到的主要內容,如果想了解詳情請下載 PDF。

PDF 下載地址

非技術一圖看懂 NLP

讓非技術也能理解 NLP

本篇內容則是 NLP 的專題,我們匯總了一些關於 NLP 的基礎內容,相信大家看完這個 PDF 後可以理解下面幾個問題:

  1. NLP 是什麼,為什麼大家要研究 NLP ?
  2. 研究和應用 NLP 的目的是什麼?
  3. NLP 在實際應用中會用到哪些方法,大概有哪些步驟?

由於是針對非技術人群的,所以內容里不會涉及到代碼或者大量的技術概念,不需要有技術基礎同樣可以看明白。

PDF 里的內容結構

NLP概念結構

上圖是 PDF 里涉及到的主要內容,下面給大家講解一下:

自然語言處理 – NLP

NLP 就是人類和機器之間溝通的橋樑!這個部分會講解 NLP 的重要性,研究 NLP 的目的,NLP 的應用方向,NLP 的大致方法和流程等內容,讓大家對 NLP 有一個宏觀的認識。

了解詳情:《一文看懂自然語言處理-NLP(4個典型應用+5個難點+6個實現步驟)

自然語言理解 – NLU

自然語言理解就是希望機器像人一樣,具備正常人的語言理解能力,由於自然語言在理解上有很多難點(下面詳細說明),所以 NLU 是至今還遠不如人類的表現。

了解詳情:《一文看懂自然語言理解-NLU(基本概念+實際應用+3種實現方式)

自然語言生成 – NLG

NLG 是為了跨越人類和機器之間的溝通鴻溝,將非語言格式的數據轉換成人類可以理解的語言格式,如文章、報告等。

了解詳情:《一文看懂自然語言生成 – NLG(6個實現步驟+3個典型應用)

分詞 – Tokenization

分詞是自然語言理解 – NLP 的重要步驟。分詞就是將句子、段落、文章這種長文本,分解為以字詞為單位的數據結構,方便後續的處理分析工作。

了解詳情:《一文看懂NLP里的分詞-Tokenization(中英文區別+3大難點+3種典型方法)

詞幹提取 – Stemming | 詞形還原 – Lemmatisation

詞幹提取和詞形還原是英文語料預處理中的重要環節。雖然他們的目的一致,但是兩者還是存在一些差異。本文將介紹他們的概念、異同、實現算法等。

了解詳情:《一文看懂詞幹提取-Stemming和詞形還原-Lemmatisation(概念、異同、算法)

詞性標註 – Part of speech

本文根據自己的學習過程以及查閱相關資料的理解,對自然語言基礎技術之詞性標註進行了相對全面的簡紹,包括定義、目前的難點以及常見方法,還推薦了一大波python實戰利器,並且包括工具的用法。

了解詳情:《一文看懂詞性標註(基本概念+4種方法+7種工具)

命名實體識別 – Named-entity recognition | NER

命名實體識別(Named Entity Recognition,簡稱NER),又稱作“專名識別”,是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等。簡單的講,就是識別自然文本中的實體指稱的邊界和類別。

了解詳情:《一文看懂命名實體識別 – NER(發展史+4類方式+數據集+工具推薦)

上面的所有內容都整理成了59頁的PDF《非技術也能看懂的 NLP 入門科普》,點擊下方按鈕進行下載。

下載《非技術也能看懂的 NLP 入門科普》

如果上面的圖片顯示有問題,請點擊這裡下載:下載鏈接