分类: 信息资源管理 发布时间: 2024-11-25
摘要:[目的/意义]先秦诸子典籍是中华民族文化的重要载体,被后世广泛引用,成为连接不同历史时期学术思想的纽带。探究《二十四史》对先秦诸子典籍的引用情况,对于理解先秦诸子思想的发展脉络具有重要意义。本研究旨在构建字词级别的引书识别框架,实现对史书中先秦诸子引书的细粒度识别与分析,从而为古文领域学者提供可靠的典籍引书细粒度识别方法,为诸子研究提供崭新的视角。[方法/过程]首先,选取无监督古汉语检索模型辅助人工标注,建立初步的《二十四史》引先秦诸子典籍语料库;其次,基于标注语料,依托大语言模型检索增强框架,构建细粒度引书识别模型,并采用人机协同迭代策略完善引书语料库、优化模型性能;最后,对史书中的先秦诸子引书开展多维度的计量分析。 [结果/结论]当检索器返回相似度最高的前三个句子时,采用Esimcse-GujiRoBERTa_ts作为古汉语文本检索器,并结合指令微调后的internlm2_5-7b-chat作为文本生成器,所构建的引书识别框架对文本是否包含引书的判断能力F1值达到98.59%,文本输出的序列标注能力F1值达到82.65%。后续的计量分析印证了以《论语》为代表的儒家思想在不同历史时期的重要地位。
分类: 信息资源管理 >> 情报学 发布时间: 2024-10-26 合作期刊: 《情报资料工作》
摘要:[目的/意义]文章旨在阐明行为经济学理论在信息行为研究中的应用和贡献,以推动其在信息行为研究中的进一步发展。[方法/过程]以国内外期刊和学术会议中发表的应用行为经济学理论的信息行为文献为研究对象,通过归纳和总结的方法,梳理了行为经济学理论在这些文献中的应用情况及理论贡献,并对未来的研究进行展望。[结果/结论]第一,目前行为经济学理论已被广泛地应用在信息检索和信息评估等研究主题。第二,行为经济学理论从理解用户信息行为中的有限理性和“非理性”行为、理解用户行为决策的损益规则、揭示认知和行为策略中的直觉推断法则、解读信息行为中的认知偏差四个方面,为揭示用户信息行为背后的认知方式和思维逻辑提供理论基础。最后,从信息行为跨学科理论发展、时代前沿的信息行为研究以及用户信息决策科学化三个方面提出相应的展望。
分类: 信息资源管理 >> 情报学 发布时间: 2024-10-08 合作期刊: 《情报资料工作》
摘要:[目的/意义]在国家文化数字化战略背景下,以线性文化遗产数据为研究对象,从哲学视角审视线性文化遗产数据语义增强机制,推动线性文化遗产数据智慧化建设。[方法/过程]文章主要从“道”“器”“用”三个维度构建线性文化遗产数据语义增强机制的认知框架,以信息加工理论和认知图式理论为基础,以用户对线性文化遗产的渐进性认知过程为研究主线,提炼出“用户感知与数据编码”“内容表征与知识联结”“语义拓展与情境解释”三个螺旋上升式认知过程,在此基础上构建线性文化遗产数据语义增强机制的技术体系。[结果/结论]文章提出的认知框架和技术体系,从顶层设计维度为线性文化遗产数据智慧化管理及开发利用提供理论层面的路径参考,为打造线性文化遗产智慧数据基础设施提供坚实的理论基础。
分类: 信息资源管理 >> 情报学 发布时间: 2024-09-24
摘要:[目的/意义]在实践理论对社会科学领域产生广泛影响的背景下,图书情报学出现了实践转向的趋势,但实践理论的应用情况尚未明晰。文章立足LIS的整体视角对实践理论的应用情况进行系统分析,有利于对LIS的实践特色有更为全面的认识。[方法/过程]文章将138篇期刊文献纳入分析范围,并基于内容分析法进行分析。[结果/结论]研究发现:首先,LIS研究的实践转向趋势在信息行为、信息素养、信息系统和知识管理等领域中日趋明显。其次,实践理论在理论视角、关键概念、研究方法和研究对象方面均促进了LIS研究的转向发展。此外,实践理论在AI背景下的信息行为、知识管理与组织实践、跨文化信息交流及信息社会问题等方面具有应用优势。
分类: 信息资源管理 >> 情报学 发布时间: 2025-01-08 合作期刊: 《情报资料工作》
摘要:[目的/意义]红色文献数量庞大、类型多样,给红色文献细粒度标注带来诸多困难,如何利用少量已有标注数据开展红色文献的自动化数据标注研究是促进红色文献智能化处理与应用研究中亟待解决的重要问题之一。文章设计红色文献的元数据表示体系,并尝试利用迁移学习技术对未标注文献进行标注实验,实现红色文献元数据知识的自动化标注。[方法/过程]首先,构建融合预训练模型、双向长短时记忆网络、多头注意力机制和条件随机场BERT-BiLSTM-MHA-CRF模型;其次,根据红色文献的内容特征,设计多组红色文献的元数据表示体系;最后,探究在不同类型的红色文献自动化标注任务中,元数据表示体系与迁移学习模型的适配性。[结果/结论]MRS 6元数据表示体系可作为通用型红色文献的元数据表示体系,“BERT-BiLSTM-MHA-CRF+MRS 6”适用于不同场景的红色文献自动化标注,在同类型红色文献的自动化标注实验中具有较好的泛化能力。
分类: 信息资源管理 发布时间: 2025-02-12
摘要:[目的/意义]古籍中的时间表达对于语义理解具有重要意义,由于大模型在各种自然语言处理任务上表现出色,因此本文探究了大模型在古籍时间表达式抽取任务上的性能。 [方法/过程]对先秦古籍语料分别进行处理,作为SikuBERT-BiLSTM-CRF进行训练和对Baichuan2-13B-Base、Baichuan2-7B-Base、Xunzi-Baichuan2-7B进行指令微调的数据集,并使用准确率、召回率、F1值作为指标验证模型的性能,最后在《汉书》等古籍上验证模型的泛化能力。[结果/结论]实验结果表明,在古籍时间表达式抽取任务中,总体来看SikuBERT-BiLSTM-CRF模型表现最优, Baichuan2-13B-Base等大模型也都具备较好的能力和不错的泛化能力,展现出大模型在该任务上的潜力。
分类: 信息资源管理 >> 情报学 发布时间: 2024-09-14 合作期刊: 《农业图书情报学报》
摘要:[目的/ 意义]探讨如何优化在线知识协作平台网络结构和平衡团队内部的知识与经验,为促进跨领域信息流通,避免信息孤岛的形成,通过集体知识协作,推动知识的创造、传播和应用。[方法/ 过程]本研究利用编程问答网站StackOverflow 的数据,筛选出含“Python”标签的问题帖和对应的回答帖,结合负二项回归模型探讨了网络结构特征和用户异质性对知识协作质量和效率的影响。[结果/ 结论]网络结构特征方面,节点中心性显著提升了协作的质量和效率,较高的聚集系数和较大的连边跨度限制了信息流通,不利于知识协作效率。用户异质性方面,知识背景和注册时长的高异质性通常阻碍协作,经验异质性中注册时长异质性对协作效果均产生负面影响,回答被采纳率异质性仅对协作质量产生了负面影响,而活动强度异质性则产生了积极影响。
分类: 信息资源管理 发布时间: 2025-02-12
摘要:[目的/意义] 运用人工智能技术对古籍进行信息化处理,能够促进中华优秀传统文化在新时代的继承与发展。分词作为自然语言处理的基础性任务,探究领域模型在中文语内分词中的表现对推进古籍研究与人工智能领域的交叉融合具有重要意义。[方法/过程] 文章首先基于百万条先秦典籍、二十四史、新时代人民日报分词语料构建中文语内分词数据集,然后对传统深度学习模型BiLSTM-CRF,古籍领域预训练模型SikuBert、SikuRoberta、GujiBert、GujiRoBerTa,古籍领域大语言模型Xunzi-Baichuan2-7B和Xunzi-Qwen2-7B进行指令微调训练,最后从评价指标和内容质量两个角度对参测模型的语内分词表现进行全面分析。[结果/结论] 在中文语内分词任务中,BiLSTM-CRF效果不佳,古籍领域Bert系列预训练模型表现优异,古籍领域大语言模型与Bert系列预训练模型效果不相上下,具备良好的泛化能力和鲁棒性,展现出了在复杂序列标注任务中的优秀潜力。
分类: 信息资源管理 >> 情报学 发布时间: 2024-10-08 合作期刊: 《农业图书情报学报》
摘要:[日的/意义]为了厘清AIGC情境下用户心理韧性的驱动因素以及AIGC用户中辍行为的特征规律,有效缓解AIGC用户在初始采纳阶段后流失和中辍等消极行为造成的潜在风险,刺激AIGC用户持续使用,促进AIGC产业由技术驱动向用户驱动的高质量转变。[方法/过程]研究以韧性理论和S-0-R理论为基础,构建了AIGC用户中辍行为影响因素研究模型,通过发放问卷的形式,搜集了328份原始数据对所构建的模型进行实证和检验。[结果/结论]研究结果显示,心理韧性是有效缓解AIGC用户中辍行为的重要因素,技术韧性和信息质量是提升用户心理韧性的重要驱动因素,以此为基础,提出了提升用户心理韧性、防止用户中辍,促进用户持续使用的对策与建议。
分类: 信息资源管理 >> 情报学 发布时间: 2024-04-11 合作期刊: 《情报资料工作》
摘要:目的/意义 从古文到现代文的机器翻译过程中,由于古文与现代文之间在词汇构成、句法以及词类活用等方面的显著差异,并且缺少公开的古文分词数据,使得机器翻译系统对古文的理解和处理能力存在偏差,一定程度上影响了翻译的质量。 方法/过程 文章提出无监督词库构建的方法,在UniLM模型的基础上,分别与BERT、RoBERTa、RoFormer和RoFormerV2预训练模型相结合并对模型进行微调,借助UniLM模型融合古文领域知识特征将源语言和目标语言之间的语言关系生成中间的语言表示,利用预训练模型学习上下文相关的语言表示,增加语义之间的关联性,从而提升古现机器翻译的性能。 结果/结论 实验结果表明,融合古文领域知识特征的古文机器翻译在BERT、RoBERTa、RoFormer和RoFormerV2预训练模型上的BLEU值分别提高了0.27到1.12,证明了提出方法的有效性。
分类: 信息资源管理 >> 图书馆学 发布时间: 2024-06-04 合作期刊: 《情报资料工作》
摘要: 目的/意义 文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。 方法/过程 研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。 结果/结论 不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。