Unsplashed background img 1

問答系統


問答系統(英語:Question answering),是未來自然語言處理的明日之星。問答系統外部的行為上來看,其與目前主流資訊檢索技術有兩點不同:首先是查詢方式為完整而口語化的問句,再來則是其回傳的為高精準度網頁結果或明確的答案字串。以Ask Jeeves為例,使用者不需要思考該使用甚麼樣的問法才能夠得到理想的答案,只需要用口語化的方式直接提問如「請問誰是美國總統?」即可。而系統在瞭解使用者問句後,會非常清楚地回答「拜登是美國總統」。面對這種系統,使用者不需要費心去一一檢視搜尋引擎回傳的網頁,對於資訊檢索的效率與資訊的普及都有很大幫助。從系統內部來看,問答系統使用了大量有別於傳統資訊檢索系統自然語言處理技術,如自然語言剖析(Natural Language Parsing)、問題分類(Question Classification)、專名辨識(Named Entity Recognition)等等。少數系統甚至會使用複雜的邏輯推理機制,來區隔出需要推理機制才能夠區隔出來的答案。在系統所使用的資料上,除了傳統資訊檢索會使用到的資料外(如字典),問答系統還會使用本體論等語義資料,或者利用網頁來增加資料的豐富性。


QAwizard 自然語言查詢系統


QAwizard是由中興大學資管系所開發,以DBpedia做為知識庫的自然語言查詢系統,經由一系列自然語言處理流程理解使用者輸入的英文問句並將其轉為適合的SPARQL陳述方式, 可回答的問題範圍以DBpedia中已存在之內容為主,本版本為QAwizard 1.0版, 1.0版透過自然語言前處理(Natural Language Preprocessing)、實體比對(Entity Mapping)、答案檢索(Answer Retrieval)和 答案型態篩選(Answer Type Filtering)四個步驟對問句進行處理,自然語言前處理步驟的目的在於取得自然語言問句中的語意資訊, 協助問答系統更精確的了解問句中的意圖。使用者輸入的自然語言問句首先由前處理程序進行斷詞並分析問句中各單詞的詞性、型態。 問句經過前處理之後,實體比對程序從問句中找出存在於知識庫(DBpedia)的相關實體,藉以作為尋找答案的線索, 我們透過實體比對程序在知識庫(Dbpedia)中找出問句動詞、名詞、專有名詞的相關實體。 答案檢索(Answer Retrieval)階段我們利用語法剖析樹(Parsing tree)分析問句內容的階層關係,透過分析語法剖析樹每階層的節點組合, 我們找出語法剖析樹中能夠形成二元關係(Binary Relation)的節點型態(Pattern),並利用節點中包含的問句內容,在知識庫中找出可能的問句解答。 答案型態篩選(Answer Type Filtering)階段會辨識問句的答案型態,並以問句的答案型態做為答案的篩選條件,得到問句最後的答案, 我們透過此方式處理如"Which movies star both Liz Taylor and Richard Burton?"、" In which city was the president of Montenegro born?"等擁有多層結構的問句,未來本團隊將持續新增對不同句型結構的處理方式進行改良。


相關論文


李欣宜(104)。自然語言問答系統基於DBpedia給予答案與建立新的關係。國立中興大學資訊管理學系所學位論文。
郭欣逸(106)。一個基於語意分析的自然語言查詢系統。國立中興大學資訊管理學系所學位論文。
歐庭銨(107)。使用兩階段機器學習的自然語言查詢系統



QAwizard is a question answering system over linked data(DBpedia).
Unsplashed background img 2