• <nav id="c5a2s"><code id="c5a2s"></code></nav>
  • 收藏本站
    收藏 | 手機打開
    二維碼
    手機客戶端打開本文

    基于深度學習的電商平臺評論情感分析系統研究

    許欣  
    【摘要】:隨著信息技術的飛速發展帶動網絡購物的迅速普及,各大電商收集了大量包含消費者主觀意見的評論信息,這些信息蘊含著巨大的商業和社會價值。要從海量的評論數據中獲得輔助決策的有效信息,采用人工智能技術挖掘評論情感信息的方案相較于人力瀏覽總結具有顯著的優勢。綜觀幾大電商平臺所獲取的商品評論數據,發現存在如下典型問題:由于評論數據中差評數量相對稀少導致的嚴重數據種類不均衡和評論數據總量大導致的數據標注難度高。在業界對評論數據的重視程度已經達成共識的今天,針對上述問題,電商平臺評論作為決策的輔助依據,如何使用深度學習技術對之進行更有效的情感信息挖掘,具有重大的研究意義。本文提出一種從語義理解角度針對電商平臺用戶評論文本的情感分析方法,將情感傾向分析問題轉換為語義主題的分類問題。由于BERT預訓練語言模型在各類情感分析任務中都表現出了不錯的效果,本文以BERT語言模型為最基本的網絡框架,在模型基礎上根據評論數據特性進行一系列改進研究,論文主要工作如下:(1)針對海量評論數據導致數據標注難度高的問題:本文使用用戶在電商平臺對本次購物的星級評價作為初始標注??紤]到這種標注存在覆蓋率不足以及用戶評價隨意等問題,本文采用聚類方法,結合開源情感字典和電商平臺評論數據,生成適用于電商評論領域的情感詞典,隨后使用該詞典對評論數據進行初步的情感分析,再將評論的情感分析結果與評論標簽進行對比匹配,從而篩選出高質量標簽數據。(2)針對差評數量稀少導致的情感分析訓練數據類別不均衡的問題:本文引入圖像領域數據增強方法Mix Match與NLP傳統數據增強回譯方法,對負例樣本進行數據增強,增加其樣本個數。由于Mix Match方法只適用于連續變量,故本文采用BERT的前10層將離散的文本向量變換成高維稠密向量,并結合篩選出的低質量標簽進行Mixup操作,得到增強數據。同時,本文進一步引入目標識別領域的Focal_Loss算法,結合Mix Match與BERT的損失函數,引入權值與調質因子,通過懲罰大規模數據與易識別數據對總Loss的貢獻,達到抵抗數據不平衡的目的。本文經過對電商平臺評論的情感分析實驗,檢驗本文提出的情感分析方法有效性,實驗結果表明,本文提出的模型效果良好,相較于普通BERT模型與傳統數據增強方法都有明顯的提升。


    知網文化
    【相似文獻】
    中國期刊全文數據庫 前16條
    1 鐘山;;基于BERT模型的陸空通話語義校驗方法的探究[J];科學技術創新;2021年09期
    2 許欣;余杉;;基于BERT與Focal Loss的電商平臺評論情感研究[J];儀器儀表用戶;2021年03期
    3 郭雷;;統計語言模型分析[J];軟件導刊;2011年11期
    4 魯一冰;劉馳;;Skip-ngram模型解決數據稀疏問題的研究[J];自動化技術與應用;2015年03期
    5 張明輝;;情感分析在商品評論中的應用[J];現代信息科技;2019年10期
    6 張仰森,徐波,曹元大;自然語言處理中的語言模型及其比較研究[J];廣西師范大學學報(自然科學版);2003年01期
    7 喬士君;;基于面向對象語言模型的自然語言處理[J];網絡安全技術與應用;2020年11期
    8 林奕歐;雷航;李曉瑜;吳佳;;自然語言處理中的深度學習:方法及應用[J];電子科技大學學報;2017年06期
    9 許銘淏;;用戶評論數據模型與信息處理[J];信息技術與信息化;2019年03期
    10 徐延勇,郭忠偉,周獻中;基于最大熵方法的統計語言模型[J];計算機工程與應用;2002年05期
    11 魏上斐;喬保軍;于俊洋;姚相宇;;基于預訓練語言模型詞向量融合的情感分析研究[J];計算機應用與軟件;2021年05期
    12 郭楊;擁措;;藏語語言模型的研究現狀及展望[J];電腦知識與技術;2020年09期
    13 田園;原野;劉海斌;滿志博;毛存禮;;基于BERT預訓練語言模型的電網設備缺陷文本分類[J];南京理工大學學報;2020年04期
    14 段瑞雪;巢文宇;張仰森;;預訓練語言模型BERT在下游任務中的應用[J];北京信息科技大學學報(自然科學版);2020年06期
    15 黃昌寧;統計語言模型能做什么?[J];語言文字應用;2002年01期
    16 仁青吉;安見才讓;;藏語語言模型的研究[J];信息與電腦(理論版);2015年06期
    中國重要會議論文全文數據庫 前20條
    1 林紅;胡欣;;最大熵模型的應用[A];新世紀氣象科技創新與大氣科學發展——中國氣象學會2003年年會“地球氣候和環境系統的探測與研究”分會論文集[C];2003年
    2 ;哈爾濱工業大學智能技術與自然語言處理研究室簡介[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術會議中文信息處理重大成果匯報展資料匯編[C];2006年
    3 鐘茂生;;自然語言中的對象及其處理[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
    4 馮志偉;;自然語言處理中的理性主義和經驗主義[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
    5 關毅;王曉龍;;基于統計的漢語詞匯間語義相似度計算[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯合學術會議論文集[C];2003年
    6 劉一聞;李澤魁;秦玉芳;;基于深度神經網絡的稿件標題生成[A];中國新聞技術工作者聯合會2020年學術年會論文集[C];2020年
    7 楊睿涵;續子愷;;自然語言處理技術在解放日報智能視覺創作系統的應用[A];中國新聞技術工作者聯合會2020年學術年會論文集[C];2020年
    8 李凡姝;姚登峰;;自然語言處理中的文本表示和語言模型綜述[A];中國計算機用戶協會網絡應用分會2020年第二十四屆網絡新技術與應用年會論文集[C];2020年
    9 張宇航;;自然語言處理在金融科技領域的應用[A];2020中國信息通信大會論文集(CICC 2020)[C];2020年
    10 吳凱文;趙媛媛;陳超;王少鋒;;自然語言處理技術、電網數據管理[A];全國第四屆“智能電網”會議論文集[C];2019年
    11 范漪萍;王曉迪;張煒;吳玉輝;劉彥君;;北京人工智能產業發展人才需求分析及精準引才對策建議[A];創新發展與情報服務[C];2019年
    12 紀寧;;教育人工智能賦能教育現代化[A];天津市社會科學界第十四屆學術年會優秀論文集:加快構建中國特色哲學社會科學 推進“五個現代化天津”建設(中)[C];2018年
    13 徐源;施洪美;趙媛媛;王少鋒;;新技術驅動的自然語言處理進展[A];全國第四屆“智能電網”會議論文集[C];2019年
    14 宇文道璐;陳錦飛;;基于腫瘤多學科討論的治療方案和人工智能臨床決策一致性評價[A];2018年中國腫瘤標志物學術大會暨第十二屆腫瘤標志物青年科學家論壇論文集[C];2018年
    15 徐超;畢玉德;;面向自然語言處理的韓國語隱喻知識庫構建研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
    16 李文;程華良;彭耀;溫明杰;肖威清;張陳斌;陳宗海;;自然語言處理云平臺[A];系統仿真技術及其應用學術論文集(第15卷)[C];2014年
    17 李生;;哈工大自然語言處理研究進展[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯合學術會議論文集[C];2003年
    18 張斌;周延泉;;一種適用于語言模型的檢索詞擴展方法[A];第五屆全國青年計算語言學研討會論文集[C];2010年
    19 付曉寅;魏瑋;徐波;;一種基于狀態轉移的N元語言模型快速查詢方法[A];機器翻譯研究進展——第七屆全國機器翻譯研討會論文集[C];2011年
    20 劉昆;張建平;顏永紅;;統計語言模型中語料的選擇[A];中國聲學學會2005年青年學術會議[CYCA'05]論文集[C];2005年
    中國博士學位論文全文數據庫 前18條
    1 才智杰;藏文詞向量表示關鍵技術研究[D];青海師范大學;2018年
    2 方蘭婷;基于機器學習的自然語言處理和傳輸技術的研究[D];東南大學;2018年
    3 郭俊飛;基于可調語言模型的機器翻譯[D];武漢大學;2015年
    4 陳志剛;英語考試自動答題技術的研究[D];中國科學技術大學;2018年
    5 文娟;統計語言模型的研究與應用[D];北京郵電大學;2010年
    6 張俊林;基于語言模型的信息檢索系統研究[D];中國科學院研究生院(軟件研究所);2004年
    7 劉陽;多標簽數據分類技術研究[D];西安電子科技大學;2018年
    8 董愛美;帶標簽和/或無標簽數據綜合利用的模式分類新方法研究[D];江南大學;2016年
    9 傅群超;基于深度學習的詞和句子表示關鍵技術研究[D];北京郵電大學;2020年
    10 高紅;基于統計語言模型的漢語淺層分析研究[D];大連理工大學;2007年
    11 任飛亮;高適應性基于實例的機器翻譯中關鍵技術研究[D];東北大學;2008年
    12 郭江;基于分布表示的跨語言跨任務自然語言分析[D];哈爾濱工業大學;2017年
    13 劉建成;模糊模型的智能學習方法與應用研究[D];中南大學;2005年
    14 冷明偉;主動半監督聚類及其在社團檢測中的應用研究[D];蘭州大學;2014年
    15 王寧;基于電子病歷的中醫臨床決策支持研究[D];中國科學技術大學;2021年
    16 陳清才;基于粗集的漢語建模及其應用研究[D];哈爾濱工業大學;2003年
    17 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年
    18 于墨;自然語言句子級結構表示的建模與學習[D];哈爾濱工業大學;2016年
    中國碩士學位論文全文數據庫 前20條
    1 許欣;基于深度學習的電商平臺評論情感分析系統研究[D];北方工業大學;2021年
    2 雷孝鈞;面向小數據量垂直領域的問答方法研究[D];北京交通大學;2020年
    3 廖浩宇;基于文段選擇的中文問答系統研究[D];暨南大學;2020年
    4 魏上斐;基于預訓練語言模型自注意力機制的情感分析研究[D];河南大學;2020年
    5 趙佳悌;網絡商品評論的情感分析研究[D];北京郵電大學;2020年
    6 梁嘯;基于預訓練語言模型的微博情感分類研究[D];南華大學;2020年
    7 張曉;命名實體識別的領域適應性研究及應用[D];山東理工大學;2020年
    8 陳波;中文統計自然語言處理隱馬模型的研究[D];重慶大學;2003年
    9 于尤婧;面向可解釋性雙向編碼語言模型的文本分類研究[D];吉林大學;2020年
    10 謝錦松;基于Bert的文本相關度研究[D];華南理工大學;2020年
    11 于尊瑞;基于預訓練語言模型的問題生成技術研究[D];中國科學技術大學;2021年
    12 唐永明;基于關聯詞的復句語言模型[D];北京郵電大學;2009年
    13 劉濤;基于預訓練語言模型的自然語言理解方法研究[D];黑龍江大學;2021年
    14 張國強;層次化蒙古語語言模型的構建研究[D];內蒙古大學;2008年
    15 黃永文;基于互信息的統計語言模型平滑技術[D];重慶大學;2005年
    16 段帥陽;初等數學問題知識圖譜的半自動構建技術研究及實現[D];電子科技大學;2019年
    17 涂文博;基于深度學習的醫療文本信息抽取[D];杭州師范大學;2019年
    18 陳梁;運用自然語言處理技術從中文電子化病歷系統中提取臨床有用信息[D];重慶醫科大學;2019年
    19 解波;基于自然語言處理及機器學習的文本分類研究[D];云南大學;2018年
    20 彭湃;自然語言處理—中文詞和短文本向量化的研究[D];華中師范大學;2019年
    中國重要報紙全文數據庫 前20條
    1 中國出版傳媒商報記者 渠競帆;國際出版AI應用發展新象[N];中國出版傳媒商報;2019年
    2 記者 宋婧;達摩院發布中文社區最大規模預訓練語言模型[N];中國電子報;2021年
    3 本報記者 李釗;自然語言處理技術可提升創新效率[N];科技日報;2020年
    4 本報記者 劉肖勇;楊敏 深耕自然語言處理 架起人類與機器溝通的橋梁[N];廣東科技報;2020年
    5 本報記者 華凌;突破自然語言處理瓶頸需大數據與富知識雙輪驅動[N];科技日報;2019年
    6 王培 美國天普大學計算機與信息科學系;機器翻譯會迫使翻譯們全失業嗎?[N];北京科技報;2016年
    7 本報記者 劉峣;人工智能創造新聞新玩法[N];人民日報海外版;2016年
    8 北京商報記者 姜紅;人工智能:市場前夜的秀場[N];北京商報;2017年
    9 歸欣;無需為“二代狗”驚慌失措[N];河南日報;2017年
    10 本報記者 張蓋倫;小心,聊天機器人也會被“教壞”[N];科技日報;2017年
    11 本報記者 馬愛平;機器人能成為“閨蜜”嗎?[N];科技日報;2017年
    12 陳宗周;重建巴別塔[N];電腦報;2017年
    13 記者 李思;企業紛紛搶先機[N];上海金融報;2017年
    14 賽迪顧問人工智能行業分析師 向陽;2017年人工智能產業發展分析與預測[N];中國信息化周報;2017年
    15 賽迪顧問人工智能行業分析師 向陽;人工智能未來三年將迎新機遇點[N];中國計算機報;2017年
    16 程瑞輝 黑龍江大學體育教研部;冬奧會“秀場”:智能、環保與人文效應[N];中國社會科學報;2017年
    17 本報記者 李中迪;希望與貴州早日達成合作[N];貴州日報;2017年
    18 本報記者 潘玥斐;對人工智能開展前瞻性哲學思考[N];中國社會科學報;2017年
    19 本報記者 藏瑾;中國人工智能人才不足美國6% 科技公司全球攬才[N];21世紀經濟報道;2017年
    20 本報記者 鄧曉蕾;語言智能是人工智能皇冠上的明珠[N];中國計算機報;2017年
     快捷付款方式  訂購知網充值卡  訂購熱線  幫助中心
    • 400-819-9993
    • 010-62982499
    • 010-62783978


    日韩无遮挡一级无码A片|国产一级毛片特级毛国产|亚洲一级av无码毛片不卡|手机农村的寡妇一级A片免费