- 數(shù)據(jù)艺挪、信息與知識
- 數(shù)據(jù)是載荷或記錄信息的按照一定規(guī)則排列組合的物理符號
- 背景是接收者針對特定數(shù)據(jù)的信息準(zhǔn)備
- 數(shù)據(jù)+背景=信息
- 信息是數(shù)據(jù)負(fù)荷的內(nèi)容
- 信息+經(jīng)驗=知識
- 信息管理與信息活動
- 廣義:信息管理是對涉及信息的各種要素(信息靶病、人轧抗、機(jī)器、機(jī)構(gòu))進(jìn)行合理的組織和控制刨肃,以實現(xiàn)信息及有關(guān)資源的合理配置,從而有效地滿足社會的信息需要。
- 信息活動就是對信息資源的開發(fā)利用
- 信息資源的開發(fā)利用黑滴,是由信息工作人員運用專門的信息技術(shù)手段對各種原始數(shù)據(jù)進(jìn)行搜集選擇。加工處理和分析研究紧索,形成信息產(chǎn)品袁辈,然后傳遞給需要者使用的過程
- 信息生命周期管理
- 信息創(chuàng)建:
信息生命周期管理的初始階段。規(guī)范的信息機(jī)構(gòu)和網(wǎng)絡(luò)用戶珠漂,自由度和隨意性晚缩,保持文檔格式、規(guī)范以及元數(shù)據(jù)描述的一致性 - 信息采集:
信息得以開發(fā)利用的起點制定采集政策媳危,明確內(nèi)容和范圍荞彼,采用相應(yīng)的方法(手工收集和自動獲取) - 信息組織:
提供結(jié)構(gòu)形成有機(jī)化整體(篩選待笑、分析鸣皂、標(biāo)引、著錄暮蹂、整序寞缝、優(yōu)化) - 信息存儲:
實現(xiàn)信息價值的基礎(chǔ)。依托相關(guān)存儲應(yīng)用技術(shù)將信息的狀態(tài)(不可得-可得-可用) - 信息利用:
信息生命周期管理的宗旨仰泻。方式:(1.建立數(shù)據(jù)庫2.提供專業(yè)信息導(dǎo)航3.開展信息增值服務(wù)) - 信息清理:
建立科學(xué)明確的數(shù)據(jù)回收(銷毀第租、清理、遷移)規(guī)則我纪。信息老化失去價值慎宾。
- 網(wǎng)絡(luò)數(shù)字信息資源管理的研究
- 網(wǎng)絡(luò)資源:
關(guān)注:網(wǎng)絡(luò)數(shù)字信息資源的數(shù)量、傳播速度浅悉、范圍及影響力
研究內(nèi)容:涉及網(wǎng)絡(luò)信息資源的組織結(jié)構(gòu)趟据、基本格式、網(wǎng)絡(luò)資源開發(fā)與服務(wù)中的權(quán)益保障 - 圖書館:
收集組織利用中心
三個研究層次:- 技術(shù)研究(圖書館自動化和館藏資源數(shù)字化)
- 現(xiàn)代圖書館建設(shè)的整體規(guī)劃和基礎(chǔ)搭建(現(xiàn)代圖書館的經(jīng)濟(jì)术健、法律汹碱、社會、政策的整體框架荞估,制定信息共享格式和國家標(biāo)準(zhǔn)咳促,網(wǎng)絡(luò)安全性和穩(wěn)定性問題)
- 結(jié)合數(shù)字圖書館的具體應(yīng)用(數(shù)字資源的生產(chǎn)稚新、保存、服務(wù)與管理跪腹,圖書館的聯(lián)盟與合作以及具體應(yīng)用的相關(guān)標(biāo)準(zhǔn)等)
- 信息網(wǎng)絡(luò):
對信息資源的開發(fā)利用起推動作用
學(xué)科門戶褂删、行業(yè)網(wǎng)站和深網(wǎng)的研究以及網(wǎng)絡(luò)生態(tài)等交叉問題的探討 - 信息檢索:
信息資源應(yīng)用與服務(wù)的重要環(huán)節(jié)
檢索的原理、方法冲茸、語言以及檢索工具屯阀、技術(shù)、系統(tǒng)和檢索性能評估等方面的研究 - 信息組織:
是網(wǎng)絡(luò)信息資源研究和核心
資源描述轴术、知識重組难衰、索引標(biāo)識、信息導(dǎo)航逗栽、主題詞表以及標(biāo)準(zhǔn)化研究 - 元數(shù)據(jù):
信息組織的基礎(chǔ)和網(wǎng)絡(luò)信息資源建設(shè)的前提
元數(shù)據(jù)標(biāo)準(zhǔn)盖袭、評價元數(shù)據(jù)。語義元數(shù)據(jù)以及本體論研究 - 用戶服務(wù):
宏觀層面:服務(wù)手段彼宠、服務(wù)機(jī)制苍凛、創(chuàng)新服務(wù)以及用戶研究
微觀層面:服務(wù)手段、服務(wù)特征兵志、服務(wù)模式醇蝴、信息營銷、個性化服務(wù) - 評價:
優(yōu)化信息檢索和用戶服務(wù)提供參考依據(jù)
指標(biāo)體系的建立想罕、評價方法的不斷完善和創(chuàng)新以及評價實證分析 - 信息資源共享:
網(wǎng)絡(luò)信息資源得以充分利用的前提和關(guān)鍵所在 - 信息資源開發(fā)利用:
信息資源的管理悠栓、信息技術(shù)、網(wǎng)絡(luò)技術(shù)在資源開發(fā)利用中的應(yīng)用以及館員在其中的職能和信息素養(yǎng)方面的研究 - 信息環(huán)境:
研究的出發(fā)點
傳統(tǒng)館藏環(huán)境按价、高校環(huán)境以及網(wǎng)絡(luò)化環(huán)境惭适、數(shù)字化環(huán)境和信息環(huán)境
-
信息交流的條件和要素
- 信息發(fā)送者:信息的初始來源(非信息機(jī)構(gòu)、圖書館楼镐、文獻(xiàn)中心等信息傳遞的中繼站)
- 信息接收者:受信者癞志。信息的最后接受者或利用者
- 交流通道:交流雙方的感官系統(tǒng)。(電話框产、郵政凄杯、網(wǎng)絡(luò)等僅僅是這些感官通道的擴(kuò)張、延伸或變換)
- 符號體系:信息交流依附的載體(語言秉宿、文字戒突、手勢、表情描睦、信物膊存、烽火狼煙等)以及符號元素之間互相聯(lián)系與組織的方式及規(guī)則
- 知識信息庫:人腦知識信息的總稱(包括發(fā)送方和接受方)。是信息交流的最根本來源和最終極的歸宿
- 支持條件:信息交流得以實現(xiàn)的保障。自然條件:聲隔崎、光今艺、電、空氣等在傳導(dǎo)信息的作用 技術(shù)條件:各種通信技術(shù)爵卒、存儲虚缎、處理技術(shù) 社會條件:法律、政策技潘、經(jīng)濟(jì)條件、信息機(jī)構(gòu)以及相關(guān)組織
正式交流與非正式交流
- 正式交流:通過科學(xué)文獻(xiàn)信息系統(tǒng)或“第三方”的控制而進(jìn)行的信息交流
優(yōu):可信度高千康。能獲得全面詳細(xì)的科學(xué)信息享幽。不需要與信息生產(chǎn)者本人見面
缺:信息傳遞不及時。需要一定的方法和技巧 - 非正式交流:科學(xué)家拾弃、研究人員之間通過個人接觸進(jìn)行的信息交流
優(yōu):間隔時間短值桩。信息選擇性和針對性強(qiáng)。傳遞信息時反饋迅速豪椿。對所得到的信息易于理解并給出恰當(dāng)?shù)脑u價
缺:可靠性和準(zhǔn)確性難以檢驗奔坟。只有少數(shù)人有機(jī)會。不能為以后得加工進(jìn)行情報積累
- 信息產(chǎn)生與分布中的馬太效應(yīng)
-
表現(xiàn):核心趨勢和集中取向
- 核心趨勢(信息生產(chǎn)者主動造成)
- 高產(chǎn)作者群體的形成
- 期刊信息密度增大
- 高頻詞匯的確立
- 集中取向(信息生產(chǎn)者處于被動狀態(tài))
- 一篇論文多次被引用
- 一個網(wǎng)站被眾多用戶點擊
- 某些圖書頻繁被借閱
- 核心趨勢(信息生產(chǎn)者主動造成)
出現(xiàn)原因:人類社會特有的選擇機(jī)制支配的結(jié)果
-
影響
正面影響:
+ 實際工作:突出重點搭盾、摒棄平均咳秉,為信息源的選擇、獲取鸯隅、評價和利用提供依舊澜建,為降低信息管理成本,提高信息利用效益提供指導(dǎo)和方法
+ 理論上:幫助我們認(rèn)識信息集中和分散的特征蝌以、趨勢和規(guī)律炕舵,發(fā)先信息管理學(xué)的基礎(chǔ)性規(guī)律負(fù)面影響:
+ 信息分布富集有時往往是表面的、外在的跟畅。
1. 表面:被引用次數(shù)多并不一定具有較高價值咽筋,可能是錯或有爭議的觀點。
2. 外在:有點優(yōu)勢積累過程中帶有突發(fā)性或受統(tǒng)計學(xué)因素的影響使得信息價值失真(獲得諾貝爾獎的作者并非每篇論文都具有較高價值)
+ 核心信息源是馬太效應(yīng)優(yōu)勢積累的結(jié)果徊件,而如果過分注重核心信息源就會忽略分布在其他信息院中有價值的信息
+ 核心信息源某一方面的優(yōu)勢過分積累奸攻,高度專門化會使得信息越來越單一,失去更多的用戶
+ 馬太效應(yīng)青睞名人虱痕、拒絕新人的習(xí)慣實力不利于新人成長舞箍,限制了新思想、新知識和新信息的產(chǎn)生和傳播
- 信息源的概念與二次信息
- 信息源的定義:個人為滿足其信息要求而獲得信息的來源
- 信息源的基本屬性:
- 客觀性:(1)是一種客觀存在的物體 (2)是信息源中所包含的知識存在的反映
- 可傳遞性: 作為信息傳播過程的第一要素皆疹,只有傳播到達(dá)接收者并得到利用才能發(fā)揮作用
- 可激活性: 在人腦進(jìn)行感知疏橄、思維、分析、綜合捎迫、聯(lián)想的過程中激活
- 信息源的特征表現(xiàn)
- 信息源的積累性:可以用物理手段進(jìn)行搜集晃酒、整理、積累使得信息不斷地延續(xù)窄绒、繼承和發(fā)展
- 信息源的復(fù)雜性:數(shù)量巨大贝次、內(nèi)容豐富、形式多樣彰导、增長迅速
- 信息源的再生性:使用后不會消耗反而產(chǎn)生“增值現(xiàn)象”蛔翅。
- 信息院的共享性:可以不同接收者同時使用
- 二次信息是對一次信息進(jìn)行加工整理后產(chǎn)生的一類信息,如書目位谋、題錄山析、簡介、文獻(xiàn)等形式的檢索工具掏父。
作用:在于報道和為查找一次信息提供線索
- 信息搜集的方法與途徑
- 采購:公開出版的書刊和發(fā)行的數(shù)據(jù)庫(經(jīng)常性笋轨、穩(wěn)定地、系統(tǒng)的搜集和獲取信息的有效方式)
形式:訂購赊淑、現(xiàn)購爵政、郵購、委托代購 - 調(diào)查:獲得記錄型信息陶缺、非記錄型信息尤其零次信息(速度快钾挟、質(zhì)量高、準(zhǔn)確性好饱岸、針對性強(qiáng))
形式:訪談等龙、現(xiàn)場調(diào)查、訪問伶贰、發(fā)放問卷蛛砰、樣品搜集、對實物黍衙、現(xiàn)場的實地考察收集 - 交換:多屬于內(nèi)部資料泥畅、非賣品±欧互相調(diào)劑互相補(bǔ)充位仁,擴(kuò)大信息來源,有利于信息的及時獲取
- 索确阶怠:不比通過購買或交換來獲得
- 檢索:手工檢索聂抢。計算機(jī)行檢索
- 信息組織的概念
- 信息組織,亦稱信息整序棠众,是利用一定的規(guī)則琳疏、方法和技術(shù)對信息的外部特征和內(nèi)容特征進(jìn)行揭示和描述有决,并按給定的參數(shù)和序列公式排列,使信息從無序集合轉(zhuǎn)換為有序集合的過程空盼。
- 分眾分類
- 一種眾多用戶參與的分布式的分類體系书幕。
- 由社群參與者運用自由定義標(biāo)簽的方式進(jìn)行協(xié)作分類
- 分類全部由用戶直接提交,分類形成過程完全自發(fā)
- 分類標(biāo)注方便靈活揽趾,但分類模糊台汇、隨意、不夠精確
- 信息檢索的步驟與信息檢索的策略
- 信息檢索的步驟
- 分析研究信息檢索課題(確定策略的根本出發(fā)點篱瞎。效率高低與成敗的關(guān)鍵)
- 選擇信息檢索工具
①提示線索型信息檢索工具(二次文獻(xiàn))書目苟呐,館藏目錄,索引俐筋,文摘牵素,工具書指南,詞典
②提供具體信息的工具書(三次文獻(xiàn))百科全書校哎,傳記資料两波,手冊瞳步,機(jī)構(gòu)名錄闷哆,地理資料,年鑒单起,統(tǒng)計資料抱怔,政府文獻(xiàn) - 確定信息檢索方法
順查法,倒查法嘀倒,抽查法屈留,追溯法,循環(huán)法 - 掌握獲取原始信息的線索
仔細(xì)閱讀测蘑,判斷是否符合檢索要求灌危,記錄信息材料的有關(guān)特征(篇名、作者碳胳、工作單位勇蝙、信息出處)以便查找原始信息 - 獲取原始信息
+ 判斷文獻(xiàn)的出版類型 + 整理文獻(xiàn)出處 + 根據(jù)出版類型在圖書館或信息機(jī)構(gòu)查找館藏目錄或聯(lián)合目錄確定館藏
- 信息檢索策略
信息檢索策略是針對檢索提問、運用檢索方法和技術(shù)而設(shè)計的信息檢索方案挨约,其目的是要打到一定的查全率和查準(zhǔn)率- 明確信息檢索課題所涉及的領(lǐng)域和范圍
- 明確所需信息的內(nèi)容及其內(nèi)容特征
- 明確所需信息的類型(文獻(xiàn)媒體味混、出版類型、年代范圍诫惭、語種等)
- 明確信息檢索課題對查新翁锡、查準(zhǔn)和查全的指標(biāo)要求
- 信息服務(wù)的含義與內(nèi)容
- 信息服務(wù)就是用不同的方式向用戶提供所需信息的一項活動,它是以信息為內(nèi)容的服務(wù)業(yè)務(wù)
- 內(nèi)容:
- 對分散在不同載體上的信息進(jìn)行搜集夕土、評價馆衔、選擇、組織、存儲食指有序化哈踱,成為方便利用的形式
- 對用戶及信息需求進(jìn)行研究荒适,以便向他們提供有價值的信息
- 信息產(chǎn)品設(shè)計
信息產(chǎn)品內(nèi)容包括以下幾個層次:
- 信息符號:表現(xiàn)信息內(nèi)容的最基本形式(文字、數(shù)字开镣、數(shù)字符號刀诬、線條、色彩等)
- 基本語義元素:一定信息編碼符號的集合邪财,表達(dá)一定的目的和語義(一段文字陕壹,一幅圖片,一段影像树埠,一張圖表)
- 邏輯信息單元:按一定目的和結(jié)構(gòu)組合起來的糠馆,體現(xiàn)為一定載體形式的信息內(nèi)容集合(文件,圖書怎憋,錄像)
- 信息集合:信息單元按一定目的和結(jié)構(gòu)組合所組成的信息集合(網(wǎng)站又碌,搜索結(jié)果列表,圖書館館藏绊袋,數(shù)據(jù)庫)
- 信息組織體系:一定應(yīng)用領(lǐng)域根據(jù)該領(lǐng)域?qū)ο蠛透拍畹膬?nèi)在聯(lián)系所形成的結(jié)構(gòu)化集合(分類體系)
- 網(wǎng)絡(luò)信息查尋行為(聯(lián)系與區(qū)別)
- 信息檢索:具有明確信息需求的網(wǎng)絡(luò)用戶借助專門信息檢索工具和使用信息檢索語言獲取所需要信息的活動
- 信息瀏覽:缺乏明確信息需求目標(biāo)或特定意圖的用戶毕匀,利用超文本鏈接方式在不同網(wǎng)絡(luò)信息節(jié)點間的自由游移從而獲得信息的行為
- 區(qū)別所在:(信息檢索相比于信息瀏覽)
- 明確確表達(dá)信息要求
- 借助具體的網(wǎng)上信息檢索工具
- 遵循網(wǎng)絡(luò)信息檢索語言規(guī)則
- 容易通過反饋、修改等人機(jī)互動方式來調(diào)整查尋策略
- 聯(lián)系:都是個體為了滿足其意識到的信息需求而采取的一系列外在的獲取信息的活動
- 用戶協(xié)同信息行為(CIB)
-
類型:
- 協(xié)同內(nèi)容創(chuàng)作:協(xié)同寫作癌别、協(xié)同知識創(chuàng)造(wikipedia)皂岔、協(xié)同多媒體創(chuàng)作
- 協(xié)同信息查尋和檢索:協(xié)同信息查尋,協(xié)同信息檢索和協(xié)同信息導(dǎo)航
- 協(xié)同信息質(zhì)量控制:社群共同制定相應(yīng)的活動規(guī)則和流程展姐,遵守一系列能被社群成員廣泛接受的標(biāo)準(zhǔn)或準(zhǔn)則躁垛,基于計算機(jī)支持的協(xié)同技術(shù),共同提升用戶生成內(nèi)容(UGC)的信息質(zhì)量(翻譯:貼吧吧規(guī))
- 計算機(jī)支持的社群信息交流:即時和延時通信圾笨、網(wǎng)絡(luò)論壇教馆、博客、維基擂达、社會化標(biāo)注土铺、社交網(wǎng)站等
這些CIB類型之間并非界限分明和相互獨立,除創(chuàng)作和查尋沒有重合外谍婉,其余兩兩之間都有交疊
- TAM和TTF模型
- TAM模型:一種測評和預(yù)測用戶對于信息技術(shù)和信息系統(tǒng)接受程度的模型舒憾、
兩個決定因素:- 感知的有用性:一個人認(rèn)為一個具體的系統(tǒng)對他工作業(yè)績提高的程度
- 感知的易用性:一個人認(rèn)為容易使用一個具體的系統(tǒng)的程度
- TTF模型是在TAM中加入考慮任務(wù)對使用的影響等因素而擴(kuò)展形成的
TTF模型認(rèn)為信息系統(tǒng)的使用績效根源于任務(wù)與技術(shù)的匹配
五個關(guān)鍵因子:任務(wù)特征 技術(shù)特征 個體特征 任務(wù)技術(shù)的匹配程度(受前三個影響) 變量因子(績效、利用率)
組織層面上:考慮匹配與效用或適應(yīng)性的相關(guān)
個人層面上:“系統(tǒng)/工作匹配”可以很好預(yù)測信息系統(tǒng)的使用情況
- 信息素養(yǎng)
- 信息素養(yǎng)的本質(zhì)是全球信息化需要人們具備的一種基本能力穗熬,包括能夠判斷什么時候需要信息镀迂,懂得如何去獲取信息,如何去評價和有效利用所需信息唤蔗。
- 公共信息資源特性
- 普遍性:免費或低廉價格提供給全體社會公眾尤其弱勢群體
- 基礎(chǔ)性:關(guān)系公眾工作探遵、學(xué)習(xí)窟赏、生活質(zhì)量的基本信息
- 公開性:可以向全民公開,不涉及國家箱季、商業(yè)機(jī)密涯穷,國家安全,個人隱私
- 共享性:可以互相交換藏雏,實現(xiàn)資源共享
- 廣泛性:在各領(lǐng)域廣泛存在全民需要
- 國家信息政策的范圍
- 確定社會的信息需求
- 設(shè)計適當(dāng)?shù)姆椒ㄒ允剐畔⑿枨蟮玫綕M足
- 促進(jìn)信息資源的有效利用
- 信息專業(yè)人員的人力發(fā)展
- 確定必須的基礎(chǔ)建設(shè)
- 確定持續(xù)的經(jīng)費支持
- 信息法律的規(guī)范作用
- 指引作用:對信息主體的行為起到導(dǎo)向拷况、引路的作用
- 評價作用:信息法律作為信息主體對他人行為的評價標(biāo)準(zhǔn)
- 預(yù)測作用:信息主體根據(jù)信息法律的規(guī)定預(yù)先估計人們相互間將怎樣行為以及行為的后果,從而對自身的行為做出合理的安排
- 強(qiáng)制作用:對信息違法行為及犯罪行為的震懾掘殴、懲罰和預(yù)防
兩個中文數(shù)據(jù)庫(萬方和cnki)
(待定)信息檢索的熱點和趨勢
- 多媒體檢索
(一)基于文本的檢索:用文本信息來描述圖像赚瘦、聲音、視頻等的語義信息奏寨,將對多媒體信息的檢索轉(zhuǎn)化為基于文本的檢索起意。 手工或者自動:OCR技術(shù)、語音識別技術(shù)病瞳、信息抽取技術(shù)揽咕。
(二)基于內(nèi)容的檢索:根據(jù)多媒體對象的內(nèi)容及上下文進(jìn)行語義環(huán)境進(jìn)行檢索,如對圖像中的顏色套菜、形狀亲善、紋理,或視頻中的場景笼踩、片段進(jìn)行特征提取與匹配逗爹。 eg:百度搜圖(圖像檢索)亡嫌、微信搜歌(音頻檢索)嚎于、CMU的infomedia數(shù)字視頻圖書館系統(tǒng)(視頻檢索)。 - 跨語言信息檢索
(一)定義:用戶以自己熟悉的語言來構(gòu)建和提交檢索提問式挟冠,系統(tǒng)據(jù)此檢索出符合用戶需求的包含多個語種的相關(guān)信息于购。
(二)按照處理的對象分類:提問式翻譯(機(jī)器翻譯)、文獻(xiàn)翻譯(其他語種的文檔信息翻譯成源語言)知染、非翻譯(利用關(guān)聯(lián)信息) - 聚合檢索
搜索時返回的結(jié)果頁面中同時包含有多種媒體類型的信息(網(wǎng)頁肋僧、視頻、音頻控淡、圖像嫌吠、文檔信息等) - 多樣化檢索
即使在同元信息的情況下,由于用戶信息需求多樣性掺炭,實際上返回信息的類型應(yīng)該也是多樣的辫诅。 - 情境檢索
其核心是進(jìn)行情境化、個性化的信息推薦涧狮,從而滿足用戶個性化信息需要炕矮,又符合用戶當(dāng)前所在社會么夫、物理、網(wǎng)絡(luò)環(huán)境和心里狀態(tài)等肤视。
比如當(dāng)你在QQ聊天的時候档痪,聊到一個話題,可以通過騰訊搜搜返回到這個話題的相關(guān)信息邢滑;百度糯米APP可以根據(jù)地理位置排序美食店結(jié)果腐螟。 - XML檢索
(一)定義:不僅僅是支持文檔級的檢索,還支持元素級(文檔片段)的檢索困后。
(二)根據(jù)檢索提問式的分類:關(guān)鍵詞檢索遭垛、結(jié)構(gòu)化檢索(對于學(xué)術(shù)文獻(xiàn)檢索,可以限制返回結(jié)果是章節(jié)操灿、段落或摘要級別的信息) - 專家檢索
(一)定義:檢索返回結(jié)果是一個個專家的名字及相關(guān)信息锯仪。
(二)專家檢索系統(tǒng)WHU-ES:利用互聯(lián)網(wǎng)信息,當(dāng)你輸入專業(yè)特定術(shù)語的時候趾盐,可以返回與特定術(shù)語相關(guān)的專家庶喜。基本思想是利用實體識別技術(shù)救鲤、專業(yè)術(shù)語詞和專家貢獻(xiàn)頻次之間的高低來進(jìn)行專家信息檢索結(jié)果的排列和呈現(xiàn)久窟。 - 問答系統(tǒng)
當(dāng)用戶輸入一個問題的時候,是靠計算機(jī)自動對文檔進(jìn)行處理本缠,而不是人來返回相應(yīng)答案斥扛。如Start,是一個專門的自然語言處理問答系統(tǒng)