二維碼
        企資網

        掃一掃關注

        當前位置: 首頁 » 企資快報 » 推廣 » 正文

        從產品經理角度解說知識為什么譜

        放大字體  縮小字體 發布日期:2022-06-07 10:33:07    作者:葉茂盛    瀏覽次數:82
        導讀

        感謝導語:知識圖譜是什么呢?又是怎么構建得?感謝從知識圖譜得應用、構建過程、數據要求等方面進行了分析,希望能給同是非技術出生得產品經理帶來幫助。因為工作中參與了一項智能問答相關得項目,所以我需

        感謝導語:知識圖譜是什么呢?又是怎么構建得?感謝從知識圖譜得應用、構建過程、數據要求等方面進行了分析,希望能給同是非技術出生得產品經理帶來幫助。

        因為工作中參與了一項智能問答相關得項目,所以我需要了解“知識圖譜”得相關知識。作為非技術出身得B端產品經理,初涉AI領域多少有點陌生和不適應。

        于是翻閱了很多文獻資料及技術科普,也請教了身邊做AI得技術同學,從中大致了解了“知識圖譜”得一些原理,并整理了以下文章。

        希望我得文章能讓同是非技術出生得產品經理,或者其他崗位得同學,能更簡單、快速地了解什么是“知識圖譜”。

        一、 知識圖譜得應用

        在介紹知識圖譜前,先說下知識圖譜在日常中得應用。

        1. 智能搜索

        舉個例子,你在使用百度搜索“楊冪”時,搜索結果除了包楊冪得個人信息及相關新聞以外,還給你展示了她得關系圈及合作過得藝人,這些人際關系信息都與“楊冪”這個關鍵字沒有重合,但因為和“楊冪”這個實體有實際關系,所以都在“楊冪”得搜索結果中。

        2. 智能問答

        在智能問答方面,會通過知識圖譜為你推理出答案。例如,你搜索“楊冪得前夫”,會直接給你返回“劉愷威”得信息。

        再舉個例子,在線上醫療行業,當患者想掛號卻不清楚該掛哪個科室時,可以通過診前助手獲取科室信息。診前助手是基于可以醫療知識圖譜,采用多種算法模型與多輪智能交去互理解病人得病情,根據病人得病情精準匹配就診科室。

        3. 個性化推薦

        在個性化推薦方面,以搜索張國榮得“胭脂扣”為例,會基于《胭脂扣》得電影信息,如演員、導演、上映年份、作品類型等,推薦出更多關聯作品。例如會推薦張國榮得其他電影、推薦同一時期(80-90年代)得香港電影、與張國榮合作過得其他演員得電影等等。

        4. 風險防范

        以支付寶為例,在支付場景中,用知識圖譜將刷單詐騙及信用卡套現等行為扼殺在搖籃中:通過知識圖譜得圖數據庫,對不同得個體、團體做關聯分析,從人物在指定時間內得行為,例如去過地方得IP地址、曾經使用過得MAC地址(包括手機端、PC端、WIFI等)、社交網絡得關聯度分析,銀行賬號之間是否有歷史交易信息等,判斷用戶是否存在風險行為。

        二、知識圖譜定義

        在描述定義之前,我們先看看知識圖譜得表現形式——【E-R圖】:

        (支持源自百度搜索)

        從上圖我們可以發現,無論E-R圖變換成什么形狀,外觀如何不同,他都是由多個點和多條線互相連接形成得關系型網絡。

        點我們稱為【實體】,線我們稱為【關系】,每個實體可能和一個或多個實體存在關系。基于此,要組成最簡單得關系型網絡,只需三個要素:兩個實體和一個關系。這樣得結構,我們稱之為“三元組”,多個三元組構成知識圖譜。

        (三元組)

        舉個例子:“小芳和小明是同事,因為工作需要,兩人都在選購筆記本。小明覺得用蘋果筆記本會更有逼格,所以入手了,而小芳覺得Lenovo得筆記本比較便宜,所以選擇了Lenovo。后來小芳發現,一直被同事安利得sketch這個軟件只在蘋果電腦有,它比Axure更智能好用。”從這句話中,我們可以拆解多個三元組:

        實體:小明、小芳、蘋果筆記本、Lenovo筆記本、Sketch。實體一般是名詞,表示得是人、事、物得抽象化對象。關系:購買、擁有、同事。關系是指兩個實體之間得聯系,這種聯系多種多樣,可以是類屬關系、并列關系等。

        知識圖譜得三元組除了可以表達實體間得關系以外,還能表示實體得某種屬性。比如“小明”是實體,他得“性別、出生日期、籍貫”等可劃為屬性。

        事物被定義為實體得“屬性”,有兩條基本準則:

          作為屬性,不能再具有需要描述得性質。屬性必須是不可分得數據項,不能包含其他屬性屬性不能與其他實體具有聯系

        同時值得注意得是,根據實際情況,實體有時可以是屬性,屬性也可以是實體。

        以下圖為例:“職工”是一個實體,“職工號、姓名、年齡”是職工得屬性,“職稱”如果沒有與“工資、文位津貼、福利”掛鉤,換句話說,沒有需要進一步描述得特性,則根據準則 1 可以作為職工實體得屬性。

        但如果不同得職稱有不同得工資、崗位津貼和不同得附加福利,則職稱作為一個實體看待就更恰當。

        (支持源自網絡,如請聯系刪除)

        說到這里,大家應該能更好理解【知識圖譜】得定義:知識圖譜是結構化語義知識庫,用于以符號形式描述物理世界中得概念及其相互關系,其基本組成單位是『實體-關系-實體』三元組,以及實體及其相關屬性-值對,實體之間通過關系相互聯結,構成網狀得知識結構。

        知識圖譜能能夠打破不同場景下得數據隔離,為搜索、推薦、問答、解釋與決策等應用提供基礎支撐。

        三、知識圖譜得構建過程

        了解知識圖譜得構建,能幫助我們更好理解知識圖譜得應用原理。

        知識圖譜得構建流程,總結有三:

        對每個步驟得介紹及其意義,我整理了如下表格:

        非商業感謝請注明出處

        下圖是知識圖譜得技術架構,可以幫助大家更好理解知識圖譜得構建流程。其中虛線框內得部分為知識圖譜得構建過程,同時也是知識圖譜更新得過程。

        (支持源自網絡,已作中文化處理,如請聯系刪除)

        四、數據要求及數據庫類型

        1)要構建知識圖譜,需要怎樣得數據呢?

        答案是:結構化得數據。

        知識圖譜得原始數據類型一般來說有三類:結構化數據、非結構化數據、半結構化數據。而最終得知識圖譜需要結構化數據作為支撐。

        所謂結構化數據,是指高度組織和整齊格式化得數據,它是可以放入電子表格中得數據類型。典型得結構化數據包括:信用卡號碼、日期、財務金額、電話號碼、地址、產品名稱等。

        與之相對得非結構化數據是指不容易組織或格式化得數據,它沒有預定義得數據模型,不方便用數據庫二維邏輯表來表現得數據。它可能是文本得或非文本得,也可能是人為得或機器生成得。

        簡單來說,非結構化數據就是字段可變得得數據,主要是一些文檔、文件等,比如一些合同文件、文章、PDF文檔等。

        而半結構化數據,是非關系模型得,有基本固定結構模式得數據,例如日志文件、XML 文檔、JSON 文檔等。

        對于非結構化數據及半結構化數據,需要我們確認從中提取哪些可用信息,并制定信息錄入規則,借助NLP等技術,將有效信息生成為結構化數據,再計入知識圖譜中。

        2)圖數據庫及關系型數據庫得差別

        知識圖譜是用圖數據庫存儲數據得。所謂圖數據庫,不是指存儲支持、圖像得數據庫,而是指存儲圖這種數據結構得數據庫。之前我們說得E-R圖,就是圖數據得可視化展示。

        不同于傳統得使用二維表格存儲數據得關系型數據庫,圖數據庫在傳統意義上被歸類為NoSQL(Not only SQL)數據庫得一種,也就是說圖數據庫屬于非關系型數據庫。為了避免內容太過技術性,這里不會對圖數據進行深入得介紹,只簡單說下圖數據庫及關系型數據庫得差別。

        關系型數據庫不擅長處理數據之間得關系,而圖數據庫在處理數據之間關系方面靈活且高性能。

        傳統得關系型數據庫在處理復雜關系得數據上表現很差,這是因為關系型數據庫是通過外鍵得約束來實現多表之間得關系引用得。查詢實體之間得關系需要JOIN操作,而JOIN操作通常非常耗時。

        而圖數據庫得原始設計動機,就是更好地描述實體之間得關系。圖數據庫與關系型數據庫蕞大得不同就是免索引鄰接,圖數據模型中得每個節點都會維護與它相鄰得節點關系,這就意味著查詢時間與圖得整體規模無關,只與每個節點得鄰點數量有關,這使得圖數據庫在處理大量復雜關系時也能保持良好得性能。

        另外,圖得結構決定了其易于擴展得特性。我們不必在模型設計之初就把所有得細節都考慮到,因為在后續增加新得節點、新得關系、新得屬性甚至新得標簽都很容易,也不會破壞已有得查詢和應用功能。

        而關系型數據庫,如果一開始就設計好數據字段并跑了一段時間數據,想再增加字段就會非常麻煩,需要開發人員或產品經理在開發初期就設想好未來可能會新增得字段,并提前加入到數據表中。

        參考資料:

        neo4j-圖數據庫

        E-R圖:實體與屬性得劃分原則

        通俗易懂解釋知識圖譜(Knowledge Graph)

        圖數據庫是什么?

        :楊桃,行業B端產品經理,愛用文字記錄觀察及想法。

        感謝由 等楊桃 來自互聯網發布于人人都是產品經理,未經許可,禁止感謝。

        題圖來自 Unsplash,基于CC0協議。

         
        (文/葉茂盛)
        免責聲明
        本文僅代表作發布者:葉茂盛個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

        粵ICP備16078936號

        微信

        關注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯系
        客服

        聯系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 国产在线一区二区在线视频| 中文字幕永久一区二区三区在线观看| 精品国产亚洲一区二区在线观看 | 夜夜爽一区二区三区精品| 无码精品人妻一区二区三区免费| 亚洲一区二区免费视频| 日本精品一区二区三区四区| 乱精品一区字幕二区| 国产成人一区二区三区在线| 精品国产亚洲一区二区在线观看| 美女视频一区二区| 精品视频在线观看一区二区三区| 午夜AV内射一区二区三区红桃视| 亚洲制服丝袜一区二区三区 | 精品一区精品二区| 精品日韩一区二区| 人妻av综合天堂一区| 国产日韩精品视频一区二区三区 | 无码视频免费一区二三区| 亚洲Av高清一区二区三区| 亚欧免费视频一区二区三区| 日本一区精品久久久久影院| 国产亚洲一区区二区在线| 中文字幕一区在线| 亚洲国产精品一区二区第一页| 亚洲毛片αv无线播放一区| 国产AV一区二区三区无码野战| 无码人妻精品一区二区三区在线 | 亚洲AV无码一区二区三区在线 | 日韩综合无码一区二区| 国精品无码一区二区三区在线| 无码人妻一区二区三区免费n鬼沢 无码人妻一区二区三区免费看 | 亚洲国产一区国产亚洲| 亚洲电影国产一区| 亚洲熟妇成人精品一区| 精品在线一区二区| 国产色情一区二区三区在线播放| 久久4k岛国高清一区二区| 亚洲欧美日韩中文字幕在线一区| 国产精品日韩一区二区三区| 日韩精品一区二区三区不卡|