知識圖譜作為大資料時代重要的知識表示方式之一,已經成為人工智慧領域的一個重要支撐。8月25日-27日,“復旦大學知識工場實驗室”與“上海財經大學資訊管理與工程學院”聯合舉辦“知識圖譜前沿技術暑假班”,對《知識圖譜-概念與技術》展開系統性介紹。
本次課程體系由復旦大學肖仰華教授策劃,講者來自復旦大學、南加州大學、湖南大學、香港中文大學、華東師範大學、微軟亞洲研究院、上海財經大學、東華大學、蘇州大學等青年學者。本次課程由上海財經大學承辦,由上海財經大學崔萬雲博士負責課程的本地組織工作。
本次課程為期三天,累計27個課時。本次課程為非盈利活動,為改寫運營成本,本次課程收取少量費用,並全部用於知識圖譜課程建設和運營開支。因場地容量有限,限260人。學員需要報名註冊,先註冊和繳費者先得。
課程時間
8月25日 – 8月27日
具體課程時間段參照日程安排表
課程地點
上海財經大學武川路校區創業中心一樓報告廳
報名方式
線上報名,點選“閱讀原文”進行報名登記,由於場地有限,本次課程限額260名,先報先得,以註冊繳費先後為準。
費用及繳費方式
費用:學生 300 元 / 人
非學生 1000 元 / 人
註:此費用僅為報名費用,參加課程人員的旅途費和食宿均為自理費用。
繳費方式
一:銀行轉賬(僅限8月9日至8月20日之間)
戶 名:上海財經大學
賬 號:454673639249
開戶行:中國銀行上海市五角場支行
說明:
① 轉賬備註“知識圖譜課程+姓名+手機號”
② 儲存包含備註資訊的支付憑證(轉賬回執單或電子回單等能證明支付的憑證),簽到時作為入場憑證
二:簽到現場繳費,僅限POS刷卡。(僅限線上報名時間為8月21日至8月25日的參加課程人員,於8月25日上午 7:30 開始在財大現場繳費)
繳費時間以線上報名登記時間為參考,即若報名登記時間為8月9日至8月20日之間,請銀行轉賬;若報名時間為8月21日至8月25日之間,請現場繳費。
建議大家以銀行轉賬的方式繳費,可以確保有座位。現場繳費僅限POS刷卡,不支援其他繳費方式,程式較慢且不確保有多餘空位。
註:學生到場簽到需出示學生證等相關證件。
日程安排
講者介紹
肖仰華 復旦大學
肖仰華博士,復旦大學教授、博士生導師、復旦大學知識工場實驗室創始人、上海市網際網路大資料工程技術中心副主任、多家規模企業高階顧問與首席科學家、知識圖譜前沿技術系列課程發起人、十多個國家/省市/企業研究獎項獲得者、三十多個國家/省市/企業研發專案負責人。在國際頂級學術會議與期刊(包括SIGMOD、VLDB、ICDE、IJCAI、AAAI、TKDE等)發表論文百餘篇,授權近20項知識圖譜專利。百餘次擔任國際/國內學術機構/會議的學術服務工作。領導構建了知識庫雲服務平臺(知識工場平臺kw.fudan.edu.cn),釋出了一系列知識圖譜,以API形式為數百家應用單位服務近10億次。
任翔 南加州大學
XiangRen is an Assistant Professor in the Department of Computer Science at USCaffiliated with USC ISI. At USC, he is part of the Machine Learning Center,NLP@USC, and Center on Knowledge Graphs. Priorly, Xiang was a visitingresearcher at Stanford University collaborating with Dan Jurafsky and JureLeskovec, and received his PhD in CS@UIUC. He is interested in computationalmethods and systems that extract machine-actionable knowledge from massiveunstructured text data, and is particularly excited about problems in the spaceof modeling sequence and graph data under weak supervision (learning withpartial/noisy labels, and semi-supervised learning) and indirect supervision(multi-task learning, transfer learning, and reinforcement learning). Hisresults were covered in several top conference tutorials and keynote (KDD, WWW,ACL) and he has served as area chairs and program committee members for topconferences including KDD, WWW, ACL and EMNLP. Xiang’s research has beenrecognized with several prestigious awards including a Google PhD Fellowship,Yahoo!-DAIS Research Excellence Award, Yelp Dataset Challenge Award, WWW BestPoster Runner-up, and David J. Kuck Outstanding M.S. Thesis Award. Technologieshe developed has been transferred to US Army Research Lab, National Instituteof Health, Microsoft, Yelp and TripAdvisor.
徐波 東華大學
徐波博士,東華大學電腦科學與技術學院講師。畢業於復旦大學電腦科學技術學院,獲計算機軟體與理論專業的博士學位。研究興趣為知識圖譜的構建及應用。建立了目前最大的中文開放知識圖譜之一:CN-DBpedia。其研究成果論文先後在IJCAI、PKDD、DASFAA等國際頂級人工智慧、資料庫會議上發表。曾獲中國資料庫學術會議優秀論文獎。
林欣 華東師範大學
林欣博士,華東師範大學計算機系教授。目前主要致力於異構大資料管理研究和知識圖譜研究。先後在該領域發表論文30餘篇,其中近三年在中國計算機學會推薦的A類頂級期刊TKDE和A類會議ICDE發表論文8篇。2011年入選首批“香江學者計劃”,赴香港浸會大學從事為期2年的訪問研究。2014年回國後入選上海市“浦江人才計劃”。現擔任SCI雜誌《Frontier of Computer Science》青年副主編,擔任TKDE、TPDS等權威學術期刊的審稿人,並多次擔任WAIM,ICPADS等國際會議的PC member。
李直旭 蘇州大學
李直旭博士,蘇州大學特聘副教授,碩士生導師。蘇州大學先進資料分析研究中心副主任。2015年獲江蘇省“雙創”博士稱號,2013年畢業於澳大利亞昆士蘭大學,獲電腦科學博士學位。主要研究方向為:知識圖譜,資訊抽取,人機問答,資料質量和眾包技術。李直旭現為CCF資料庫專委會委員,人工智慧學會智慧服務專委會委員。承擔國家自然科學基金及江蘇省自然科學基金重大專案等國家和省部級專案5項。已在資料管理相關領域的頂級期刊和會議如TKDE, ICDE, EDBT, CIKM等上發表論文60餘篇。長期擔任國際期刊IEEE TKDE, WWWJ審稿人,並擔任過多個資料管理領域國際會議的程式委員會委員。
邵斌 微軟亞洲研究院
邵斌博士,微軟亞洲研究院機器學習組主管研究員。他的研究興趣包括機器學習、並行圖處理、分散式系統和記憶體資料庫等。邵斌博士於 2010 年加入了微軟亞洲研究院,具體負責微軟分散式大規模圖資料處理引擎專案(Microsoft Graph Engine)。相關研究結果發表在SIGMOD, VLDB, ICDE, TPDS等相關領域頂級會議和期刊上。
彭鵬 湖南大學
彭鵬博士,2009 年畢業於北京師範大學資訊科學與技術學院獲得工學學士學位;2016 年畢業於北京大學電腦科學技術研究所,獲得工學博士學位。2016 年入職湖南大學資訊科學與工程學院軟體工程系,任助理教授。目前其主要研究方向為“基於圖的分散式RDF 知識庫資料管理”。彭鵬近年來發表論文 12 篇,其中既包括 VLDB Journal、TKDE 等國際頂級期刊論文,也包括 EDBT、WWW Journal、Information Systems 等國際重要會議/期刊論文。主持國家級專案 1 項,為國家自然科學基金青年基金專案——“關聯資料上基於圖的分散式查詢處理技術研究”。這些論文的工作涵蓋了 RDF 資料管理,分散式查詢處理以及圖資料管理等領域。目前我們已經開發了多種分散式 RDF 資料管理演演算法、圖資料庫上的子圖匹配查詢演演算法以及 RDF 資料中關鍵詞查詢演演算法。
鄭衛國 香港中文大學
鄭衛國博士,畢業於北京大學,香港中文大學博士後,他的主要研究興趣為圖資料的管理和查詢,特別是在知識圖譜上的查詢和挖掘,在國際頂級會議和期刊上發表多篇論文,包括SIGMOD、VLDB、ICDE、TODS、TKDE、CIKM等。
陽德青 復旦大學
陽德青博士,復旦大學大資料學院和大資料研究院副院長、副教授,於2013年在復旦大學電腦科學技術學院獲得計算機軟體與理論專業的博士學位。陽博士的主要研究領域為資料挖掘、知識圖譜的構建與應用、推薦系統、社會網路分析等,其研究成果論文先後在WWW、ICDM、CIKM、ECML等資料科學領域的國際頂尖學術會議上發表,並擁有多項發明專利。同時,他先後主持、參加了多項國家科技部、自科基金委、上海市科委、經信委、教委等專項課題,併在與阿裡、華為等科技公司的合作中取得了豐碩的實際應用成果。
崔萬雲 上海財經大學
崔萬雲博士,上海財經大學資訊管理與工程學院助理教授,智慧金融課題組負責人,小Cui問答(微信公眾號)和KBQA專案負責人。他僅以4年時間就獲得了復旦大學5年制博士學位,同時獲得了復旦大學最高博士榮譽“復旦學術之星”(計算機方向唯一)。其博士論文《基於知識圖譜的問答系統關鍵技術研究》被授予了“2017ACM中國優秀博士生論文提名獎”,和“2017ACM上海優秀博士生論文獎”(top 2 in 上海)。和他的研究興趣包括自然語言問答和知識圖譜。自2012年起,他分別在微軟亞洲研究院、百度深度問答小組和小i機器人等公司從事問答系統、知識圖譜相關研究。他已經在PVLDB 2017,IJCAI 2016,AAAI 2016,SIGMOD 2014,SIGMOD 2013等頂級人工智慧、資料庫會議上發表第一作者論文。他還曾獲得復旦大學畢業生之星、上海市優秀畢業生等獎項。
課程大綱目錄:
第一部分 知識圖譜概述
1.1 知識圖譜基本概念
1.2 知識圖譜的歷史沿革
1.3 知識圖譜的特點
1.4 知識分類
1.5 典型知識圖譜
第二部分 知識圖譜構建
1 詞彙挖掘與物體挖掘
1.1 詞彙挖掘
1.2 同義詞、縮寫詞挖掘
1.3 物體識別
1.4 物體分類
2 關係抽取
2.1 關係挖掘概述
2.2 基於Pattern的挖掘
2.3 基於傳統機器學習模型的關係抽取
2.4 基於深度學習的關係抽取
2.5 遠端監督與關係獲取
3 概念知識圖譜構建
3.1 概念圖譜概述
3.1.1 常見的概念圖譜
3.1.2 概念圖譜的應用
3.2 isA關係抽取
3.2.1 YAGO:從Wikipedia中構建概念圖譜
3.2.2 Probase:在英文語料上進行isA關係抽取
3.2.3 CN-Probase:中文isA關係抽取
3.3 isA關係補全
3.3.1 知識缺失的成因
3.3.2 基於isA傳遞性的圖譜補全
3.3.3 基於相似物體的圖譜補全
3.4 isA關係糾錯
3.4.1 錯誤的成因
3.4.2 簡單的想法:知識的支援度
3.4.3 概念圖譜中的抽象層級衝突
3.4.4 在概念圖譜中進行消環
4 大規模百科圖譜構建
4.1 百科圖譜概述
4.1.1基本概述
4.1.2構建方法分類
4.2 基於單源的百科圖譜構建
4.2.1半結構化知識抽取
4.2.2本體構建
4.2.3物體分類
4.2.4屬性/關係填充
4.2.5知識圖譜更新
4.3 基於多源的百科圖譜構建
4.3.1通用本體構建
4.3.2物體對齊
4.3.3屬性對齊
4.3.4屬性值融合
5 眾包構建
5.1 知識型眾包基本概念
5.2 知識型眾包的研究問題
5.2.1What(將什麼交予眾包)
5.2.2Whom(將任務交予誰完成)
5.2.3How(如何完成眾包)
5.3 基於眾包的知識圖譜構建與精化
5.3.1本體構建階段的眾包介入
5.3.2知識圖譜精化階段的眾包介入
5.4 總結
6 質量控制
6.1 知識圖譜質量評估與控制概述
6.1.1知識圖譜質量的評估維度
6.1.2知識圖譜質量的評估方法
6.1.3知識圖譜質量控制的研究問題
6.2 知識圖譜構建中的質量控制
6.2.1知識來源的可信度評估
6.2.2知識獲取方法的可信度評估
6.2.3語意漂移問題的處理技術
6.3 知識圖譜中的缺失知識補全
6.3.1關係資料庫中可計量資料的補全
6.3.2關係資料庫中不可計量資料的補全
6.3.3知識圖譜中缺失物體的補全
6.3.4知識圖譜中缺失關係的填補
6.4 知識圖譜中的知識統一與修正
6.4.1關係資料庫中的知識統一與修正技術
6.4.2知識圖譜中的知識統一與修正技術
第三部分 知識圖譜管理
1 圖資料庫系統
1.1 圖系統與知識圖譜
1.1.1為什麼需要圖系統
1.2 知識圖譜對圖系統提出怎樣的需求
1.2.2圖系統基本架構
1.3 典型圖系統
1.3.1選擇因素
1.3.2系統對比
2 建模與儲存
2.1 概述
2.2 圖論基礎
2.3 知識圖譜的邏輯表示
2.4 知識圖譜的物理儲存
2.5 總結
3 查詢與檢索
3.1 知識圖譜上查詢概述
3.2 查詢語言:SPARQL
3.3 子結構查詢
3.4 關鍵字查詢
第四部分 知識圖譜應用
1 基於知識圖譜的語言理解
1.1 概述(物體、概念、主題)
1.2 物體理解(字元的物體化)
1.2.1物體識別與連結
1.3 概念理解(物體的概念化)
1.4 主題理解(概念的主題化)
2 基於知識圖譜的搜尋與推薦
2.1 基於知識圖譜的搜尋
2.1.1意圖理解
2.1.2物體搜尋
2.1.3物體探索
2.2 傳統推薦系統的侷限與挑戰
2.3 基於知識圖譜的物品畫像
2.3.1知識融合畫像的傳統模型
2.3.2知識融合畫像的深度學習模型
2.4 基於知識圖譜的使用者畫像
2.4.1綜合歷史物品特徵的使用者畫像
2.4.2基於概念化標簽的使用者畫像
2.5 基於知識圖譜的跨領域推薦
3 基於知識圖譜的問答
3.1 知識問答概述
3.2 經典方法:基於規則的知識問答
3.3 基於深度學習的知識問答
3.4 基於語意模板學習的知識問答
3.5 混合問答及知識問答最新趨勢
3.6 總結
第五部分 實踐與問題
1 領域知識圖譜落地實踐
1.1 什麼是領域知識圖譜DKG
1.2 領域知識圖譜與通用/開放領域知識圖譜的關係是什麼
1.3 為何需要符號化表示的知識圖譜
1.4 為什麼需要領域知識圖譜
1.5 領域知識圖譜系統的生命週期
1.6 領域知識圖譜的知識如何表示
1.7 領域知識圖譜如何構建
1.8 領域知識圖譜的評價標準
1.9 領域知識圖譜如何儲存
1.10 領域知識圖譜如何查詢
1.11 領域知識圖譜如何使用
1.12 領域知識圖譜落地的最佳實踐
1.13 領域知識圖譜還存在哪些挑戰
2 知識圖譜中的開放問題
2.1 知識表示
2.1.1隱形知識的表達
2.1.2知識圖譜語意表達能力的增強
2.2 知識獲取
2.2.1大規模常識獲取與理解
2.2.2樣本稀疏環境下的領域知識獲取
2.2.3端到端的知識獲取
2.2.4知識獲取中的人機協作
2.3 應用
2.3.1知識圖譜與可解釋人工智慧
2.3.2符號知識與神經網路的融合
2.3.3知識引導下的機器學習
2.3.4知識引導下的機器語言認知
2.3.5知識引導下的搜尋與推薦
主辦單位
上海財經大學資訊管理與工程學院
復旦大學知識工場實驗室
http://kw.fudan.edu.cn
關於PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智慧前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號後臺點選「交流群」,小助手將把你帶入 PaperWeekly 的交流群裡。
▽ 點選 | 閱讀原文 | 立刻報名