-
當前位置:首頁 > 創(chuàng)意學院 > 技術(shù) > 專題列表 > 正文
元數(shù)據(jù)可分為哪三類
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于元數(shù)據(jù)可分為哪三類的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、DC 元數(shù)據(jù)在成果地質(zhì)資料編目中的應(yīng)用
李 磊 李效廣 張良軍 鄭錦娜 王心華
(天津地質(zhì)調(diào)查中心)
摘 要 本文主要研究了 DC 元數(shù)據(jù)和成果地質(zhì)資料編目之間的映射關(guān)系,探討了如何在此基礎(chǔ)上基于 XML schema 技術(shù)對生成的地質(zhì)資料核心元數(shù)據(jù)進行建模,并利用其來構(gòu)建分布式共享平臺體系。
關(guān)鍵詞 DC Dublin Core XML schema OAI 地質(zhì)資料 編目
0 引言
成果地質(zhì)資料是指各類地質(zhì)工作或?qū)n}研究項目完成時,按相應(yīng)技術(shù)規(guī)范的規(guī)定和原項目設(shè)計要求,以文字、圖、表等形式提供的一整套科技文件材料。我國地質(zhì)資料館成果地質(zhì)資料案卷級目錄庫多采用國土資源部頒布的《地質(zhì)資料電子目錄著錄格式規(guī)定(試行)》或中國地質(zhì)調(diào)查局發(fā)展研究中心制訂的規(guī)則標準而建,文件級編目采用《原始地質(zhì)資料清理數(shù)據(jù)庫》系統(tǒng)標準。以這些標準完成的編目,在實現(xiàn)資料檢索、傳播、共享、服務(wù)、利用方面一直起著非常重要作用。然而,此類編目與地學數(shù)據(jù)庫元數(shù)據(jù)抑或其他文獻編目平臺無法實現(xiàn)交換。事實上,成果地質(zhì)資料作為一種地質(zhì)專業(yè)文獻,具有文獻的共性,與其他文獻目錄庫互為交換是必要的,特別是與地學信息元數(shù)據(jù)實現(xiàn)共享是必要的。
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),是關(guān)于信息資源的形式、主要內(nèi)容、存放位置等信息的綜合。目前,元數(shù)據(jù)技術(shù)研究已經(jīng)深入到各個領(lǐng)域,有專業(yè)領(lǐng)域的元數(shù)據(jù),如關(guān)于地理空間數(shù)據(jù)的數(shù)字地理空間元數(shù)據(jù)、圖書館文獻館藏資源的機讀目錄。也有適用范圍廣泛的元數(shù)據(jù),如都柏林核心元數(shù)據(jù)。筆者經(jīng)過對比各種元數(shù)據(jù),認為成果地質(zhì)資料作為地質(zhì)信息資源的重要載體,雖然有空間信息,但是其結(jié)構(gòu)和內(nèi)容并不符合空間數(shù)據(jù)的標準。成果地質(zhì)資料作為一類文獻資源,雖然可以以機讀目錄編目,然而機讀目錄由于其字段復(fù)雜,對錄入人員專業(yè)要求較高,適用類型狹窄,故考慮到與其他類型資源的交換問題,其并不適于作為通用的元數(shù)據(jù)標準。而都柏林核心元數(shù)據(jù)(Dublin Core,DC)簡單易用,其最初是為描述網(wǎng)絡(luò)資源,現(xiàn)已發(fā)展成可以描述任何信息資源的元數(shù)據(jù)標準,應(yīng)用范圍廣泛,便于組織與數(shù)據(jù)交換,可以提高檢索數(shù)據(jù)的準確性。
筆者通過研究認為,利用都柏林核心元數(shù)據(jù)(DC 元數(shù)據(jù))編目成果地質(zhì)資料,可很好地解決異地多源數(shù)據(jù)共享的問題,會更有利于促進成果地質(zhì)資料社會化服務(wù)。
1 成果地質(zhì)資料編目與 DC 元數(shù)據(jù)的映射
1.1 成果地質(zhì)資料編目
成果地質(zhì)資料是指物理上的一套地質(zhì)資料,除了其具有檔案的基本編目信息外,還有具體的文件級資料內(nèi)容信息。根據(jù)其內(nèi)容形式的不同,成果地質(zhì)資料文件由 8 類資源組成:正文、審批、附圖、附表、附件、數(shù)據(jù)庫和軟件、多媒體和其他。這些資源信息全部以表的形式存儲在成果資料目錄數(shù)據(jù)庫中[1]。
以原始地質(zhì)資料清理數(shù)據(jù)庫為例,成果地質(zhì)資料案卷級編目主要字段包括館藏機構(gòu)編號、館藏機構(gòu)名稱、資料編號、資料名稱、資料類別、資料類型、語種、編寫報告單位、編著者、形成(提交)時間、工作程度、密級、關(guān)鍵詞、關(guān)鍵詞(礦產(chǎn))、地理坐標、行政區(qū)劃、內(nèi)容提要、工作時段,共計 18 個字段;文件級編目的所有 8 類資源的共有字段包括:資料編號和資料名稱,其中審批需要增加審批機構(gòu)和審批日期,附圖則需要增加比例尺。
1.2 DC 元數(shù)據(jù)字段
都柏林核心元數(shù)據(jù)產(chǎn)生于 1995 年,經(jīng)過 10 年不斷擴展和完善,形成了 15 個基本核心元素,通過限定詞對元素進行細化和修飾的元數(shù)據(jù)方案,用于描述越來越豐富的網(wǎng)絡(luò)信息。DC 元素依據(jù)其所描述內(nèi)容的類別和范圍,可分為三組[2]:①資源內(nèi)容描述類元數(shù)據(jù)項 7 個:分別為 Title、Subject、Description、Language、Source、Relation、Coverage;②知識產(chǎn)權(quán)描述類元數(shù)據(jù)項 4 個:Creator、Publisher、Contributor、Rights;③外部屬性描述類。元數(shù)據(jù)項 4 個:Date、Type、Format、Identifier。具體字段的定義參見表 1。
DC 限定詞是對 15 個元素的語義進行限定和修飾的詞。它的制訂遵循著名的向下兼容原則,即修飾詞的語義包含于未修飾詞中,在范圍上對未修飾詞的語義進行限定,在深度上對未修飾詞的語義進行延伸[3]。
1.3 映射關(guān)系
筆者通過對比研究,認為:
(1)案卷級編目字段除了Format(格式)外,其余14個基本元素皆可與DC核心元素建立起對應(yīng)關(guān)系。在覆蓋范圍(Coverage)元素中,由于地質(zhì)資料兼具時間特征與空間特征,故采用限定詞spatial(空間范圍)和 temporal(時間范圍)對覆蓋范圍進行描述;此外,由于成果地質(zhì)資料部分元素具有行業(yè)特殊性,需要增加三個自定義字段作為補充,分別為Districts(行政區(qū)劃)、DataCategory(資料類別)和WorkingDegree(工作程度)。而Relation(關(guān)聯(lián))與Contributor(其他責任者)在成果資料目錄庫中無對應(yīng)字段,需要單獨填寫。其中Relation(關(guān)聯(lián))填寫的內(nèi)容為成果地質(zhì)資料所含的所有文件級內(nèi)容的唯一標識碼,關(guān)系為部分為(HasPart),即所描述的案卷級資源在物理或邏輯上包含被參照文件級資源,Contributor(其他責任者)填寫數(shù)據(jù)庫錄入人員姓名。
(2)文件級的各類資源中,由于各自屬性內(nèi)容有所差別,最終分為三類資源:第一類資源為正文、附表、附件、數(shù)據(jù)庫和軟件、多媒體和其他這六類文件級資源,均與 DC 核心元素建立起 4 個對應(yīng)關(guān)系,其中 Format(格式)和 Relation(關(guān)聯(lián))這兩個元素在庫中無對應(yīng)字段。需要說明的是:這里 Format(格式)填寫的是地質(zhì)資料的媒體類型和資源大小。在這六類資源中,數(shù)據(jù)庫和軟件、多媒體資源只有源電子文件[1],其余均有源電子文件和存檔電子文件。Relation(關(guān)聯(lián))填寫的是文件級資料所對應(yīng)案卷級資料的唯一標識碼,關(guān)系為部分于(is part of)。第二類資源為審批資源,其在第一類資源的基礎(chǔ)上增加了Creator(創(chuàng)建者)和 Date(日期)兩個元素來表示審批機構(gòu)和審批日期。第三類資源為附圖資源,其在第一類資源的基礎(chǔ)上增加了自定義字段比例尺(Scale)。
通過將 DC 字段的定義和原始地質(zhì)資料清理數(shù)據(jù)庫中的字段定義進行比對,最終得出了 DC 元數(shù)據(jù)與該數(shù)據(jù)庫字段的映射關(guān)系,案卷級編目對應(yīng)關(guān)系如表 1 所示,文件級編目對應(yīng)關(guān)系如表 2、3、4 所示,由此確定了成果地質(zhì)資料核心元數(shù)據(jù)的元素集。在該核心元素集中,如果映射關(guān)系成立,則沿用 DC 元數(shù)據(jù)的元素名稱,若未找到對應(yīng)關(guān)系,則采用自定義元素名稱。
表 1 DC 元數(shù)據(jù)與成果地質(zhì)資料案卷級編目映射關(guān)系表
續(xù)表
表 2 DC 元數(shù)據(jù)與成果地質(zhì)資料文件級正文、附表、附件、數(shù)據(jù)庫和軟件、多媒體和其他資源編目的映射關(guān)系表
表 3 DC 元數(shù)據(jù)與成果資料文件級審批資源編目的映射關(guān)系表
表 4 DC 元數(shù)據(jù)與成果資料文件級附圖資源編目的映射關(guān)系表
2 實現(xiàn)方法
XML(Extensible Makeup Language)是一種結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)的標志語言,由互聯(lián)網(wǎng)聯(lián)合組織(W3C)所開發(fā)和創(chuàng)建,其目的不僅在于滿足不斷增長的網(wǎng)絡(luò)應(yīng)用需求,更是為了確保在通過網(wǎng)絡(luò)進行交互合作時,具有良好的可靠性和互操作性,XML 作為一種獨立于系統(tǒng)的表達數(shù)據(jù)信息的標記語言,更適合于元數(shù)據(jù)在網(wǎng)絡(luò)系統(tǒng)中進行數(shù)據(jù)交換。
XML Schema 是采用 XML 語法描述,提供描述和控制 XML 文檔的一種規(guī)范。用于定義 XML 文檔中使用的元素、屬性和數(shù)據(jù)類型,簡單地講,就是利用一個通用模式,生成具有不同數(shù)據(jù)但相同結(jié)構(gòu)的XML 數(shù)據(jù)文檔。Schema 與 XML 文檔的關(guān)系,相當于類和對象之間的關(guān)系。有了 XML Schema,XML 文檔的寫法就有了限制,利用 XML Schema 對成果地質(zhì)資料核心元數(shù)據(jù)進行建模生成的 XML 元數(shù)據(jù),可以便于資源在網(wǎng)絡(luò)系統(tǒng)中進行數(shù)據(jù)管理,從而更好地實現(xiàn)傳輸。
具體實現(xiàn)過程中可以使用 altova 公司的 XML spy 工具完成成果地質(zhì)資料核心元數(shù)據(jù)的建模,生成HTML 或者 Word 形式的 XML schema 文檔?;诮N臋n,開發(fā)人員可以依托相關(guān) xml 技術(shù),比如apache 公司的 XMLBeans[4],實現(xiàn)查詢成果資料目錄數(shù)據(jù)庫中的對應(yīng)數(shù)據(jù),通過 Schema 來修飾生成需要的 XML 文檔,整個過程皆可以用代碼實現(xiàn),無需多次錄入數(shù)據(jù)。最終將生成的 XML 元數(shù)據(jù)文檔以 XML混合數(shù)據(jù)庫(hybird database)形式存儲。經(jīng)過對比研究,作者認為基于 XML schema 技術(shù)可很好地實現(xiàn)成果地質(zhì)資料核心元數(shù)據(jù)表達。
3 實例
以下是基于 xml 來描述的一條地質(zhì)資料案卷級目錄元數(shù)據(jù):
第八屆全國地質(zhì)檔案資料學術(shù)研討會文集
“內(nèi)蒙古阿拉善地區(qū)礦產(chǎn)資源潛力評價綜合研究”項目是中國地質(zhì)調(diào)查局 1999 年 10 月下達的地質(zhì)調(diào)查綜合研究項目(任務(wù)書編號:0499201021;項目編號:K1.1.4.4;科研項目編號:DK9902033)。在前人工作基礎(chǔ)上,該項目以板塊構(gòu)造、邊緣成礦和成礦系統(tǒng)理論為指導(dǎo),緊緊圍繞本區(qū)礦產(chǎn)資源評價工作的部署,以野外地質(zhì)調(diào)查為基礎(chǔ),從本區(qū)實際出發(fā),重點開展了工作區(qū)已知礦點和重要物化探異常區(qū)的野外地質(zhì)調(diào)查;開展了區(qū)域地球化學背景、層控型朱拉扎嘎式金礦、火山巖型銅金礦和與花崗巖有關(guān)的金礦床等的研究工作,進一步厘定了各類礦床的成礦地質(zhì)條件和控礦因素,明確了找礦標志,歸納了區(qū)域成礦規(guī)律,篩選了物化遙異常,并在此基礎(chǔ)上圈定了找礦有利的預(yù)測區(qū),編制了阿拉善地區(qū) 1∶50萬區(qū)域成礦預(yù)測圖,提出了下一步工作部署建議。
第八屆全國地質(zhì)檔案資料學術(shù)研討會文集
第八屆全國地質(zhì)檔案資料學術(shù)研討會文集
4 成果地質(zhì)資料數(shù)據(jù)共享技術(shù)探討
基于網(wǎng)絡(luò)的成果地質(zhì)資料數(shù)據(jù)共享,主要存在兩個問題:首先,成果地質(zhì)資料分布比較分散,服務(wù)方式不盡相同;其次,用戶是分布的,其背景、教育程度、熟練程度等相差很大。因此必須研究一種合適的分布式數(shù)據(jù)的共享體系來整合這些分散的數(shù)據(jù)資源,為互聯(lián)網(wǎng)用戶提供統(tǒng)一的數(shù)據(jù)共享服務(wù)[5]。
作者經(jīng)過比較國內(nèi)外常用的分布式共享平臺體系,認為 OAI(open archives initiative)數(shù)據(jù)資源整合模式比較適合成果地質(zhì)資料數(shù)據(jù)共享。OAI 對外提供了開放文檔元數(shù)據(jù)采集協(xié)議(OAIMH)。它最主要的目標就是通過元數(shù)據(jù)采集模式來實現(xiàn)網(wǎng)絡(luò)上發(fā)布信息的不同組織之間的互操作,為其提供一個與應(yīng)用無關(guān)的元數(shù)據(jù)互操作框架。OAIMH 基于 HTTP 協(xié)議,返回的數(shù)據(jù)采用 XML 格式,所有的存儲必須為自己的資源產(chǎn)生 Dublin Core 的元數(shù)據(jù)以供交換,由此來實現(xiàn)各個節(jié)點之間的網(wǎng)絡(luò)互操作。數(shù)據(jù)生產(chǎn)者無需完全開放自己的本地資源,只需共享元數(shù)據(jù),這樣既不用改變本地存儲數(shù)據(jù)的軟件結(jié)構(gòu),又能輕松實現(xiàn)聯(lián)合檢索和數(shù)據(jù)共享。不失為一種經(jīng)濟的互操作模式,故將成果地質(zhì)資料目錄轉(zhuǎn)換為 DC 元數(shù)據(jù)能在更大范圍內(nèi)與其他科學數(shù)據(jù)實現(xiàn)共享交換。由于篇幅限制,對共享平臺如何實現(xiàn)不做進一步的論述。
5 結(jié)論
用 DC 標準來設(shè)計成果地質(zhì)資料核心元數(shù)據(jù)完全可行,基于 XML schema 技術(shù)可以實現(xiàn)建模,最終生成 XML 元數(shù)據(jù)文檔。最終在基于 OAI 協(xié)議的數(shù)據(jù)資源整合模式下構(gòu)建分布式共享平臺,交換生成的地質(zhì)資料核心元數(shù)據(jù),將能更好地實現(xiàn)成果地質(zhì)資料的共享與服務(wù),進而能最大限度地發(fā)揮地質(zhì)資料信息的潛在價值,服務(wù)整個社會。
參 考 文 獻
[1] 李效廣等 . 機讀目錄在成果地質(zhì)資料管理中的應(yīng)用前瞻 . 中國地質(zhì)學會第二屆學術(shù)研討會論文集,[C]. 2010
[2] 劉芳,朱沙 . 數(shù)字圖書館中基于 XML_RDF 的 DC 元數(shù)據(jù)描述體系 [J]. 大學圖書情報學刊,2005
[3] 盛劍鋒 . 電子期刊 MARC 與 DC 編目數(shù)據(jù)比較 . 圖書館論壇 [J],2008,(2):104 ~ 107
[4] 楊典華,楊志剛 . 基于 XML 和 DC 元數(shù)據(jù)標準研究教育資源的元數(shù)據(jù)及其數(shù)據(jù)傳播 . 現(xiàn)代教育技術(shù) [J],2006,(16):57 ~ 67
[5] 諸云強 . 地球系統(tǒng)科學數(shù)據(jù)共享關(guān)鍵技術(shù)研究 M. 北京:科學出版社, 2009:36 ~ 57
二、Ceph RGW:數(shù)據(jù)的存儲及尋址
RGW是一個對象處理網(wǎng)關(guān)。數(shù)據(jù)實際存儲在ceph集群中。利用librados的接口,與ceph集群通信。RGW主要存儲三類數(shù)據(jù):元數(shù)據(jù)(metadata)、索引數(shù)據(jù)(bucket index)、數(shù)據(jù)(data)。這三類數(shù)據(jù)一般存儲在不同的pool中,元數(shù)據(jù)也分多種元數(shù)據(jù),存在不同的ceph pool中。
1、 Metadata
元數(shù)據(jù)信息包括:user,bucket,以及bucket.instance。其中:
user: 主要是對象存儲的用戶信息
bucket:主要維護bucket name與bucket instance id之間的映射信息
bucket.instance:維護了bucket instance信息
查看user的元數(shù)據(jù)如下:
radosgw-admin metadata list user:
radosgw-admin metadata get user:testid:
radosgw-admin metadata list bucket:
radosgw-admin metadata get bucket:first:
radosgw-admin metadata list bucket.instance:
radosgw-admin metadata get bucket.instance:first:{bucket_id}
2、Bucket Index
bucket index主要維護的是一個bucket中object的索引信息。一個bucket對應(yīng)一個或多個rados object(開啟bucket shards下)。維護的是一個key-val的map結(jié)構(gòu),map存放在object的omap(rocksdb)中,key對應(yīng)的rgw object,val是關(guān)于rgw object的一些元數(shù)據(jù)信息,檢索bucket的存放的object時,需要這些信息。omap也包含一個Header,其存放的是bucket account info,如此bucket中Object的個數(shù),總的size等。
3、Data
rgw object內(nèi)容,存放在一個或多個rados object中。rados object分為header和tail部分,header最多可以容納512KB的數(shù)據(jù),如果一個rgw object的大小小于512KB,那么只有header。否則剩余的數(shù)據(jù)會按照集群rados object的大小條帶化分割成多個rados object。
在Pool: {zone}.rgw.meta利用namespace隔離多個存儲空間:
對于Pool: {zone}.rgw.log也包含多個namespace:
當檢索對象存儲中的一個object時,會包含三個要素:user,bucket,object。user主要是RGW用于獲取user id驗證ACL;bucket及obejct用于確定object在pool中的位置。
User
user數(shù)據(jù)存儲在 {zone}.rgw.meta:users.uid 中,如下:
包含兩部分: ups3: user本身信息; ups3.buckets: 用戶所屬的bucket。
ups3: 用戶的基本信息,及ACL/Bucekt Quota/User Quota等;對應(yīng)struct RGWUserInfo, 定義于rgw_common.h。
ups3.buckets:用戶所屬的Buckets,key-value結(jié)構(gòu),存放于omap結(jié)構(gòu)中;對應(yīng)struct cls_user_bucket_entry,定義于rgw_common.h,數(shù)據(jù)操作如下:
通過{uid}.buckets查到用戶具有哪些buckets,并且這些bucket以下基本數(shù)據(jù)。
Bucket
Bucket信息存在在 {zone}.rgw.meta:root 中,如下:
first: 記錄了bucket與bucket_instance_id的對應(yīng)關(guān)系,其對應(yīng)于數(shù)據(jù)結(jié)構(gòu):struct RGWBucketEntryPoint
.bucket.meta.first:1c60b268-0a5d-4718-ad02-e4b5bce824bf.44166.4: bucket instance;尋址方式:.bucket.meta.{tenant}:{bucket.name}:{bucket_id};對應(yīng)結(jié)構(gòu)體:struct RGWBucketInfo。
其中Bucket ACL及IAM Policy存放在bucket instance object的attr中。如下:
獲取Bucket ACL及IAM Policy數(shù)據(jù)如下:
Object
Bucket Index: Bucket中包含的Object信息,都存放在一個或多個Object的 omap 中。此omap為一個key-value結(jié)構(gòu),key為object的名稱,value對應(yīng) struct rgw_bucket_dir_entry : cls_rgw_types.h 。
Bucket Index Object:
如下:
在此bucket下,有一個object: ntp.conf:
檢索value:
omap header記錄了以下統(tǒng)計信息:
對象存儲object的數(shù)據(jù)存放在pool: {zone}.rgw.buckets.data 中。object的構(gòu)成及尋址分為以下兩類:
一個RGW Object可以由一個或多個rados object構(gòu)成。其中第一個 object 是此RGW 的 head 對象,主要包含一些元數(shù)據(jù)信息,如 manifest, ACLs, content type, ETag, and user-defined metadata 。這些metadata存放在此head 對象的xattr中。其中 manifest 描述了此rgw object在分布情況。同時,此head對象,最多可額外容納 4MB 數(shù)據(jù),如果RGW Object大小下于 4MB ,那么此 RGW Object就不會分片,只有此 head 對象。
如下檢索:
目前bucket下有一個 ntp.conf , <4MB 。檢索其 manifest :
如上:
max_head_size: 表示head對象最大size;
head_size: 表示當前head 對象size;
prefix: 用于在rados中分片object的尋址。
RGW OBject ACL:
上傳一個 >4MB 的 RGW Object,檢索其 manifest 信息:
Manifest信息:
根據(jù) manifest 檢索對象:
對于一個大的RGW Object,會被切割成多個獨立的RGW Object上傳,稱為multipart。multipar的優(yōu)勢是斷點續(xù)傳。s3接口默認切割大小為15MB。
在此,上傳一個60MB大小的Object。
分成了四個部分上傳,查看rados對象:
包含了三類對象, head,multipart,shadow 。
multipart 下的 manifest :
所有的object的檢索是根據(jù)上述manifest信息構(gòu)建object index:
在上以上的信息中,此RGW Object大小為48128000字節(jié),分為4段,三段15MB,最后一段為920KB。同時每段存儲在rados集群中的條帶化大小為4MB。因此15MB大小的分段,也分為4個rados object,一個multipart首部,及3個shadow分片。920KB大小的分段只有一個multipart首部。
.rgw.root :
包含的都是zone,zonegroup,realm等信息
三、3、元數(shù)據(jù)信息采用哪兩個文件進行保存?
(1)規(guī)則庫
規(guī)則是數(shù)據(jù)質(zhì)量檢查的具體標準,主要包括大數(shù)據(jù)的約束規(guī)則、合理性規(guī)則和檢查規(guī)則等。規(guī)則分為三類:約束規(guī)則、計算規(guī)則和條件規(guī)則。
約束規(guī)則描述了一種必須為真或假的強制規(guī)則。這種約束可以是結(jié)構(gòu)化約束,也可以是行為約束。
➢ 結(jié)構(gòu)化約束:當創(chuàng)建術(shù)語或者改變術(shù)語之間的關(guān)系時,結(jié)構(gòu)化約束能夠保證術(shù)語的完整性。
➢ 行為約束:典型地被定義為“前置條件”和“后置條件”。只有在符合“前置條件”的情況下,操作才能夠正確地執(zhí)行;“后置條件”保證了操作結(jié)果的正確性,“后置條件”表示該行為是否滿足了其預(yù)期的結(jié)果。例如,客戶在開戶時余額為0,在能夠使用移動業(yè)務(wù)之前,必須先充值,這里的前置條件就是必須先充值,而后置條件是指所辦理的業(yè)務(wù)是否成功辦理。
(2)算法庫
算法庫主要是指支撐上述規(guī)則所需要的基本算法的集合,這些算法結(jié)合具體的規(guī)則由數(shù)據(jù)質(zhì)量檢查相關(guān)功能調(diào)用。
3)度量信息
度量信息是數(shù)據(jù)質(zhì)量檢查的基本依據(jù),它反映了數(shù)據(jù)質(zhì)量的衡量標準,也是元數(shù)據(jù)管理模塊技術(shù)元數(shù)據(jù)的一個重要組成部分。
度量信息是經(jīng)驗的積累,需要在數(shù)據(jù)質(zhì)量不斷建設(shè)的過程中逐步精確化。隨著衡量標準的不斷細化和精確,大數(shù)據(jù)系統(tǒng)的數(shù)據(jù)質(zhì)量也會不斷提高。
四、數(shù)據(jù)庫和元數(shù)據(jù)的關(guān)系是什么,怎樣來區(qū)分它倆?
元數(shù)據(jù),就是表示數(shù)據(jù)的數(shù)據(jù),只要不是我們存儲到數(shù)據(jù)庫里的數(shù)據(jù),大多都可以理解為元數(shù)據(jù)。描述數(shù)據(jù)庫的任何數(shù)據(jù)—作為數(shù)據(jù)庫內(nèi)容的對立面—是元數(shù)據(jù)。因此,列名、數(shù)據(jù)庫名、用戶名、版本名以及從SHOW語句得到的結(jié)果中的大部分字符串是元數(shù)據(jù)。數(shù)據(jù)庫就是存放數(shù)據(jù)的倉庫。
以上就是關(guān)于元數(shù)據(jù)可分為哪三類相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
北京市作家協(xié)會主席(北京市作家協(xié)會會員名單)