• <nav id="c5a2s"><code id="c5a2s"></code></nav>
  • 收藏本站
    收藏 | 手機打開
    二維碼
    手機客戶端打開本文

    基于強化學習的機票動態定價策略研究

    劉澤霖  
    【摘要】:隨著互聯網和旅游業的高速發展,在線旅行社(OTA)憑借出色的服務逐漸取代了傳統的旅游代理商,成為人們旅行購票必不可少的一部分。而在OTA所經營的諸多業務中,機票業務占據了相當大的一部分。出于自身利潤的考慮,OTA希望能夠通過對機票產品價格的動態調整,最大化機票銷售的利潤。目前,大多數OTA都是通過在為航空公司代售機票并在此基礎上額外收取一筆傭金來賺取利潤,許多OTA嘗試通過基于自身行業經驗來調整傭金以獲得更多利潤。但由于在真實世界中機票的需求和用戶的行為模式十分復雜,因此專家經驗以及數學模型等方法應用在調價決策上存在著許多缺點?;趶娀瘜W習算法擅長解決策略優化問題的特點,本文采用強化學習的算法來對動態定價的策略進行研究。另一方面,由于強化學習的訓練需要通過和環境不斷進行交互來完成,而在動態定價問題中,直接和真實環境進行交互將會在市場上帶來非常巨大的負面作用??紤]到這兩個因素,如何模擬用戶的行為并以此為基礎開發出能夠體現市場真實反饋的模擬環境是一個十分重要的研究。因此,我們提出了一種機票購買仿真模型。該模型可以根據歷史數據模擬生成用戶群體,再根據機票價格等其他信息,模擬用戶的購買行為。模型還能夠根據歷史數據和新產生的數據不斷調整自身參數,擁有一定的自學習能力并且使仿真模型具有更好的效果。此外,在強化學習算法的研究中,由于定價問題中市場、用戶有著不確定性較高的特點,因此強化學習算法的表現會受到狀態不可測所帶來的影響。同時,用戶的消費需求也會隨著外部條件改變而改變,使用同一種定價模式無法兼顧到不同需求的用戶,必然導致模型的效果不夠優秀。所以基于上述兩點,我們提出了一種基于模式轉換的循環神經網絡強化學習算法。最后在真實世界的數據集上的實驗結果表明,我們的用戶模擬仿真模型可以較好地模擬出用戶的行為,同時我們的強化學習動態定價算法在和其他算法的對比中表現良好。


    知網文化
    【相似文獻】
    中國期刊全文數據庫 前19條
    1 張佳彤;;打車軟件參與下出租車動態定價策略研究[J];唐山學院學報;2016年06期
    2 孔德洋;王敏敏;馬丹;;電動汽車分時租賃動態定價策略研究[J];上海汽車;2017年01期
    3 董春利;王莉;;基于粒子濾波的強化學習算法研究[J];無線互聯科技;2016年15期
    4 張欣;戴帥;;基于模糊聚類的分層強化學習算法[J];計算機工程與科學;2010年01期
    5 岳曉娟;;零售商定價策略研究綜述[J];中小企業管理與科技(上旬刊);2013年03期
    6 李春貴;多步截斷優先掃描強化學習算法[J];計算機工程;2005年11期
    7 李學勇,歐陽柳波,李國徽;基于隱偏向信息學習的強化學習算法[J];南華大學學報(理工版);2004年02期
    8 李春貴,劉永信,陳波;多步截斷行動—評價強化學習算法[J];內蒙古大學學報(自然科學版);2005年02期
    9 李春貴;劉永信;王萌;;集成規劃的行動-自適應評價強化學習算法[J];內蒙古大學學報(自然科學版);2008年03期
    10 殷鋒社;;基于知識的Agent強化學習算法分析與研究[J];電子設計工程;2011年11期
    11 鄭宇;羅四維;呂子昂;;基于模型的層次化強化學習算法[J];北京交通大學學報;2006年05期
    12 王培屹;;淺析強化學習算法研究與應用[J];科技信息;2011年11期
    13 黃浩暉;楊宛璐;陳瑋;;基于性能勢的A*平均獎賞強化學習算法研究[J];計算機仿真;2014年07期
    14 謝光強;陳學松;;一種新的基于蟻群優化的模糊強化學習算法[J];計算機應用研究;2011年04期
    15 何源;張文生;;基于核方法的強化學習算法[J];微計算機信息;2008年04期
    16 董亞曉;楊寒冰;樊浩;;分布式強化學習算法在異常財務數據分析中的應用[J];電子設計工程;2021年13期
    17 趙娜;陳合稚;;考慮損失規避和參考效應的聯合庫存和定價策略研究[J];物流技術;2016年12期
    18 董春利;王莉;;基于粒子濾波的直接策略搜索強化學習算法研究[J];江蘇科技信息;2017年07期
    19 楊旭東;劉全;李瑾;;一種基于資格跡的并行強化學習算法[J];蘇州大學學報(自然科學版);2012年01期
    中國重要會議論文全文數據庫 前20條
    1 鄒哲;蔣寅;萬濤;朱海明;于春青;;居住地選擇模型及其在天津的實證研究[A];公交優先與緩堵對策——中國城市交通規劃2012年年會暨第26次學術研討會論文集[C];2012年
    2 汪賢裕;彭怡;;引入風險機制的廠商—經理選擇模型[A];中國運籌學會第六屆學術交流會論文集(上卷)[C];2000年
    3 徐華;;理性選擇模型與利他主義[A];用科學發展觀統領中國經濟發展——全國高校社會主義經濟理論與實踐研討會第十九次大會論文集[C];2005年
    4 楊文國;黃鈞;池宏;祁明亮;;信息缺失下的應急方案選擇模型及算法研究[A];第九屆中國管理科學學術年會論文集[C];2007年
    5 魏瑩;鄧黎;;基于收益管理的云服務定價策略研究[A];中國系統工程學會第十八屆學術年會論文集——A13其他管理領域的創新研究成果問題[C];2014年
    6 陳宗海;段家慶;任皴;羅楊宇;李成榮;;針對機器人覓食任務的強化學習算法及其仿真研究[A];'2008系統仿真技術及其應用學術會議論文集[C];2008年
    7 劉坤;張婷婷;柴來;;基于強化學習算法的智能體路徑尋優[A];2019第七屆中國指揮控制大會論文集[C];2019年
    8 楊清清;郭滕達;李本先;;不確定環境下合約市場中服務產品動態定價策略研究[A];第十四屆中國管理科學學術年會論文集(上冊)[C];2012年
    9 楊轉玲;陳希鎮;;風險修正下的證券組合選擇模型[A];中國現場統計研究會第十三屆學術年會論文集[C];2007年
    10 王立榮;陸強;周德明;;自我約束情景下的行為選擇模型探討及解釋[A];第十八屆中國管理科學學術年會論文集[C];2016年
    11 周小亮;;偏好、制度與選擇:理性選擇模型質疑、反思與重構[A];外國經濟學說與中國研究報告(2011)[C];2010年
    12 何文芳;楊華;;人力資源配置的三維選擇模型研究[A];中國企業運籌學學術交流大會論文集[C];2007年
    13 岳曉寧;陳達人;;滑雪場的定價策略研究[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
    14 孟祥萍;苑全德;皮玉珍;;基于量子理論的多Agent系統強化學習研究[A];'2006系統仿真技術及其應用學術交流會論文集[C];2006年
    15 李琳;范體軍;;面向零售商主導的生鮮農產品供應鏈的定價策略研究[A];第十六屆中國管理科學學術年會論文集[C];2014年
    16 趙麗艷;顧基發;;R&D項目選擇模型綜述[A];系統工程與可持續發展戰略——中國系統工程學會第十屆年會論文集[C];1998年
    17 趙喜;張根保;李明;李平;;基于目標最優的質量改進方案選擇模型[A];第三屆中國質量學術論壇論文集[C];2008年
    18 李靜坤;程冰心;;基于Agent的并行仿真模型靜態劃分方法研究[A];2020中國系統仿真與虛擬現實技術高層論壇論文集[C];2020年
    19 林潔;覃海燕;王婧;;牽引空投仿真模型體系研究[A];2020中國系統仿真與虛擬現實技術高層論壇論文集[C];2020年
    20 謝文碩;謝波;;基于EBOM的性能仿真模型研究[A];2020中國航空工業技術裝備工程協會年會論文集[C];2020年
    中國博士學位論文全文數據庫 前20條
    1 陳興國;基于值函數估計的強化學習算法研究[D];南京大學;2013年
    2 袁銀龍;深度強化學習算法及應用研究[D];華南理工大學;2019年
    3 尚筱雅;基于改進強化學習算法的終端電網在線等值建模方法及其應用[D];華南理工大學;2018年
    4 鄭宇;分層強化學習算法及其應用研究[D];北京交通大學;2009年
    5 戴朝暉;基于混合抽象機制的多智能體系統動態分層強化學習算法研究[D];中南大學;2012年
    6 孫曉梅;多源交通信息下的動態路徑選擇模型與方法研究[D];吉林大學;2011年
    7 倪訓友;基于Agent仿真模型的城市停車誘導信息板選址優化及其動態信息發布方法[D];上海交通大學;2017年
    8 雷永林;仿真模型重用理論、方法與異構集成技術研究[D];國防科學技術大學;2006年
    9 李博;高速鐵路票額分配和動態定價優化研究[D];北京交通大學;2019年
    10 宋文波;以旅客需求為導向的高速鐵路票額分配理論和方法研究[D];北京交通大學;2019年
    11 孫德杰;多條件下商品動態定價及庫存控制方法研究[D];燕山大學;2017年
    12 周東祥;多層次仿真模型組合理論與集成方法研究[D];國防科學技術大學;2007年
    13 朱智;模型驅動的裝備仿真模型語義工程化建模技術研究[D];國防科技大學;2018年
    14 陳超;語境驅動的仿真模型可組合性測試方法研究[D];國防科學技術大學;2007年
    15 孫立光;步行設施內的行人行為微觀仿真模型研究[D];清華大學;2009年
    16 楊柳青;道路交通流仿真模型構建及其應用研究[D];北京工業大學;2014年
    17 方峻;基于元胞自動機的行人微觀仿真模型研究與應用[D];清華大學;2012年
    18 劉國慶;深度強化學習中樣本效率提升方法研究[D];中國科學技術大學;2021年
    19 楊尚東;基于任務先驗的強化學習探索研究[D];南京大學;2019年
    20 程引;基于強化學習的時間序列決策系統設計與應用[D];上海交通大學;2018年
    中國碩士學位論文全文數據庫 前20條
    1 劉澤霖;基于強化學習的機票動態定價策略研究[D];上海交通大學;2020年
    2 劉飛宇;面向復雜問題的強化學習算法研究[D];中國科學技術大學;2021年
    3 劉慧敏;大學生的投資理財行為特征分析[D];中南財經政法大學;2019年
    4 賀露露;基于結構化的組稀疏投資選擇模型[D];西安工程大學;2019年
    5 楊文豪;混合特征選擇模型在妊娠期糖尿病診斷中的應用研究[D];太原理工大學;2019年
    6 瞿衛東;考慮風險規避的路徑選擇模型研究[D];吉林大學;2018年
    7 程展鴻;兩類組合路徑選擇模型的隨機交通悖論特性分析[D];哈爾濱工業大學;2018年
    8 高怡;一日游景點選擇模型研究[D];河北工業大學;2016年
    9 趙翔宇;基于沖突選擇模型的用戶偏好挖掘及活動參與預測研究[D];中國科學技術大學;2017年
    10 劉環環;工業企業節能政策工具選擇模型研究[D];大連理工大學;2009年
    11 涂錚錚;基于進化和強化學習算法的動態路徑規劃研究[D];電子科技大學;2020年
    12 李金霞;基于稀疏約束的圖嵌入特征選擇模型研究[D];青島大學;2020年
    13 張琪;送貨上門與門店自提模式下零售商線上定價策略研究[D];西南財經大學;2019年
    14 潘輝燕;速研科技公司SaaS服務定價策略研究[D];深圳大學;2019年
    15 張瑞玲;考慮團購時間和團購尺寸的網絡團購定價策略研究[D];河北工業大學;2017年
    16 王林煒;考慮贈品促銷的預售模式下電商定價策略研究[D];東南大學;2017年
    17 李玥;基于服務質量的航空公司動態定價策略研究[D];南京航空航天大學;2018年
    18 岳曉春;蘭州尚品生活館項目定價策略研究[D];蘭州大學;2013年
    19 翁可成;中小企業信用風險及定價策略研究[D];福州大學;2017年
    20 張艷;國際市場進入模式的演進及選擇模型闡釋[D];對外經濟貿易大學;2005年
    中國重要報紙全文數據庫 前11條
    1 記者 田金剛;德誠珠寶集團副總裁方思杰:企業布局“一帶一路”要建立科學的選擇模型[N];中國黃金報;2018年
    2 通訊員 陳新建 瞿月朗;強化學習 聚焦“四風”創出特色[N];西安日報;2014年
    3 勇文;連鑄結晶器保護渣選擇模型[N];世界金屬導報;2006年
    4 本報特約通訊員 王赫;帶你玩轉陸??仗煨卵b備[N];中國國防報;2017年
    5 張山;中國古建仿真模型出口大有作為[N];國際商報;2006年
    6 李雪;動態定價或加重就醫負擔[N];廣西日報;2020年
    7 趙勇;動態定價促進航空公司收益水平提升[N];中國民航報;2019年
    8 本報記者 龍昊;科技將保障消費金融運行[N];中國經濟時報;2017年
    9 方欣;航空公司動態定價迎來決定性時刻[N];中國民航報;2017年
    10 本報記者  姜恒;日本:實行動態定價 藥價逐年走低[N];中國醫藥報;2006年
    11 荷蘭保險行業IBM 全球企業咨詢服務部負責人 Koos Quak 全球企業咨詢服務部財務管理顧問 Gert-Jan van Zuijlen;AI動態定價助力險企更貼近市場[N];中國銀行保險報;2019年
     快捷付款方式  訂購知網充值卡  訂購熱線  幫助中心
    • 400-819-9993
    • 010-62982499
    • 010-62783978


    日韩无遮挡一级无码A片|国产一级毛片特级毛国产|亚洲一级av无码毛片不卡|手机农村的寡妇一级A片免费