首頁 > 娛樂資訊 > 開心樂園 > 論述性文本分類

論述性文本分類

來源:秀美派    閱讀: 8.9K 次
字號:

用手機掃描二維碼 在手機上繼續觀看

手機查看

論述性文本分類,文本分類是一種常見的類型,在閱讀的時候需要掌握一定的技巧,這樣才能更快的提高閱讀的水平。以下就是小編爲大家整理的一些關於論述性文本分類的資料,大家一起來看看吧!

論述性文本分類1

論述性文本分類

1、用問題引領

要正確認知該文章闡述說明、分析、介紹了什麼,作者爲什麼要這樣做,其中心意思是什麼,是怎樣表達和寫作的,並標示出來,做到心中有數。據此可提出諸多問題,以助展開高效閱讀。如可設計以下問題:

1、文本主要談的是什麼問題或就什麼事情闡述道理?

2、作者的基本立場、觀點、情感和態度是怎樣的?

3、本文依照怎樣的順序佈局謀篇、組織文章?其段落之間的關係如何?

4、行文中爲突顯立意主要運用了哪些手段和材料?

2、從整體把握

1、先看標題,預測內容

文章標題有的是論點,有的是話題,閱讀文章之前,可以先根據題目預測一下文章內容,閱讀文章過程中,不論預測是得到印證還是被推翻,都有助於對文意的整體把握。

2、快速閱讀,把握大意

第一遍閱讀的目的是瞭解文本的基本內容,爲下一步做題時的比較、篩選信息打好基礎,如瞭解中心論點、主要論據等。閱讀時應該用稍快的速度,重點放在文章的首尾或段首段尾表達觀點的語句上,而對那些舉例性質的文字可以一掃而過。

3、逐段閱讀,細緻梳理

一般論述類文章,不論其論述對象是歷史現象還是文藝現象,都屬於議論文的大範疇,都會符合議論文的文體結構規律的要求。閱讀時可一畫觀點,二標材料,這樣材料是材料,觀點是觀點,材料從屬於哪個觀點,從空間位置上就能看出來。

3、多角度操作

高考對一般論述類文章閱讀考查側重於邏輯思維能力,主要讓考生藉助語文學習的方法和規律,捕捉語言信息,主動獲取知識,而不是要求考生全面、系統、透徹地弄懂相關科技知識,更不是從專業知識理解的角度來考查。對一般論述類文章的閱讀與解題,我們要運用一些與之相適應的閱讀解題方法。

1、分清類屬——範疇

先要認定文章類屬,是歷史文化類的,還是文學藝術類的、教育倫理類的,文章類屬不同,話題就不同。認定類屬,有助於喚起回憶,調動知識儲備,迅速進入文章特定內容。

2、強化概括——論點

一般論述類文章閱讀,往往要從歸納內容要點的角度來命題。既有文章局部的內容要點歸納,也有全文的內容要點歸納。平時要強化從文章中找句子並進行概括的能力訓練。

3、收集材料——論據

要特別注意收集文中的材料論據。有用來證實自己觀點的,有用來反駁別人觀點的,有用來表述某種看法的,有肯定的,有否定的,還有局部肯定局部否定的,這些都要分清。

4、注重技巧——論證

一般論述類文章謀篇佈局的技巧和修辭技巧等主要是爲說理服務的。鑑賞時不要脫離所說之“理”做孤立分析。從論證方法上來講,要注重引證,例證,對比等。

論述性文本分類2

1、概述

文本分類是在nlp中很重要的模塊。也是nlp任務中比較基礎的模塊。可以應用到很多領域:比如情感分析,新聞分類,垃圾郵件過濾等等。應用是非常廣泛的。目前文本分類分爲傳統方法和深度學習的方法。在深度學習中文本分類又可以分文有監督學習的和無監督學習。但是無論何種方法文本分類最終應該是屬於數學的集合的歸類問題。

,則變成多分類問題、f函數,我們稱之爲f分類器或者說文本分類模型。根據分類器的發展,通常可以將文本分類的'發展分爲兩個階段:1、傳統方法階段 2、深度學習階段

本文將文本分類開發過程中關鍵的幾個模塊進行描述,包括前期的分類體系,數據工程和模型,測試。主要描述工程方面遇到的一些問題。

2、確定分類體系。

其實在分類前期除了做數據處理和特徵的選擇外,最應該先了解的是分類體系。確定好分類類型和分類體系是完成任務好任務的關鍵。如果是簡單的幾個分類倒是還好。但是一旦類別多了就很難說的清楚誰應該屬於哪一類別。確定好的分類體系應該明確以下幾點:

1、類別之間有無重疊邊界是否清晰

2、類別之間有無上下級關係

3、輸入數據是否存在於所有類別。

整個分類體系的建立,需要專業性,完備性和系統性。前期如果對算法的輸入沒有個完備的分類體系後期對於算法開發人員,測試以及產品人員都是不好的。會有很多沒必要的爭吵。

3、數據的預處理。

數據預處理包括中文分詞、去除噪音和數據增強。當然還有pca降維等方式對數據進行處理,根據工程任務也可能會有其他很多方式這裏不詳細講述。

分詞:分詞應該很容易理解了,有很多分詞的工具比如jieba分詞,ltp分詞等等。其實在後面會講到在用一些比較強大的深度學習模型以後可能不需要分詞。

去除數據的噪音:比如停用詞的,是,了等等、,還有就是業務上需要去除的,有些文本不是很乾淨的,有的是有亂碼或者其他字符,可能也是需要你把他去除。比如我在業務中又遇到過ocr後數據會有很多句號,很多“囧”,或者韓國的文字,或者日本的文字出現。

數據增強:在文本太少的時候,模型或者算法達不到好的效率,可以採用一些數據增強的方法進行數據的增加。

時尚熱點
影視動漫
娛樂爆料
明星八卦
電影電視
音樂圈
開心樂園