分类: 信息资源管理 >> 档案学 发布时间: 2024-07-25 合作期刊: 《档案与建设》
摘要:文章解析了档案机构主导的机器学习应用于档案管理的实验项目,旨在 充分认识机器学习应用的可行性以及应用逻辑与方法。基于对澳大利亚新南威尔士 州机器学习实验的过程分析,发现充足且高质量的数据集、软硬件等基础设施及专业 人才是机器学习技术成功应用的重要因素。因此,档案机构应用机器学习技术可从 推进档案数据化进程、加强技术型人才储备、立足档案管理实践制定应用方案等方向 探索。
分类: 社会学 >> 人口学 发布时间: 2025-04-07 合作期刊: 《西北人口》
摘要:在中国人口面临剧烈转型,生育率不断走低的当下,生育成为关乎国家发展与个体与家庭生活的一项重要议题,而社交媒体的兴起为理解育龄人群的生育态度提供了契机。研究基于四个不同社交媒体平台超24万条的文本,试图描摹当下中国互联网上有关生育的议题现状,梳理背后话语体系的构建逻辑。基于监督分类的机器学习,文章发现,生育议题高度集中在“生育现状和趋势”“生育困境成因”和“生育支持政策”这三大主题上,它们彼此交叠衍生,共同构成了互联网上有关生育话语体系的基本结构。在面对“生育率降低”这一宏观现象时,人口问题的公共性与生育行为的私事化形成张力,奠定了生育话语体系的情绪基调,成为生育议题叙事的核心特征。针对生育困境的讨论则进一步揭示出当下的低生育水平以“成本约束”下的资源供需困境为主,兼具“价值导向”的文化观念转型,且二者的子类别紧密交织,呈现多维度的相互勾连。与“生育支持政策”相关的讨论在三大议题中占比最高,网络民众的政策诉求集中于综合支持体系的构建、提高支持力度、消解潜在风险等方面。生育议题的公私混合叙事形态及其背后的张力,既是社会转型和个体化进程的产物,也受到社交媒体传播机制的塑造,理解这一张力为解决当下的生育困境提供了可能路径。
分类: 应用经济学 >> 产业经济学 发布时间: 2025-04-16 合作期刊: 《商业经济与管理》
摘要:基于共享单车项目的多维度大样本数据,以套索回归、岭回归、随机森林和迭代决策树等机器学习模型,探讨了共享单车短期(基于小时)需求预测的主要影响因素,并对不同模型预测效果进行了比较分析。研究结果发现,影响共享单车小时需求的主要因素包括特定的位置因素、时间因素以及天气条件因素。同时,相比普通线性回归、套索回归和岭回归模型,随机森林和选代决策树模型对共享单车短期即时需求预测的结果更精确,在样本内部拟合和样本外推预测中的拟合优度(R")更高,标准误差(RMSE)更低,是共享单车行业短期实时需求精准预测的更有效手段。
分类: 工商管理学 >> 会计学 发布时间: 2025-03-03 合作期刊: 《财会月刊》
摘要:近年来,全球经济一体化与金融市场发展导致上市公司财务舞弊频发。随着上市公司财务数据积累和财务比率多样性增加,大数据与机器学习方法在识别舞弊中的应用成为研究热点。然而,机器学习模型受限于其“黑盒”特性,如何在提高模型精度的同时,增加其透明度和可解释性,已成为学界和业界共同面临的挑战。本文引入一种基于XGBoost 框架的可解释机器学习模型,使用加权交叉熵损失函数处理非均衡样本,通过将加权模型简化为单棵决策树,以清晰的树状结构为业界决策者提供明确的逻辑解释。同时,创新性结合上市公司年报中的 MD&A 文本信息,实证检验文本变量在提升财务舞弊识别性能上的有效性。研究结果表明:加入文本变量后,模型识别准确率达到89.32%,较仅考虑财务与非财务指标时提升了15.73%;利用加权交叉熵为少数类样本赋予更高权重后,召回率提高至 86.51%。本文引入的可解释机器学习方法以其简单、透明及高准确性的特点,为财务舞弊识别提供了一种可解释的代价敏感解决方案,为业界决策者提供了指导。
分类: 综合学科 >> 综合学科 发布时间: 2025-02-20
摘要:《乙酉家乘》作为日记体散文,具有时空意识明确、内容真实客观、文字简洁凝练、信息丰富多样的特点。该文不仅体现出黄庭坚“以史笔为文”的创作观念,还承载着作者或隐或现、复杂幽微的私人情绪。筛选出能够反映作者情绪的152篇有效日记,反复三次阅读文本得到建模者主观判断作者情绪的结果。统计分析可知,三次判断结果均一致的数量占比高达87.5%,验证了选择文本的有效性和主观判断情绪的稳定性。将三次判断一致的133篇日记作为标签集数据,同时选择特征集数据,通过机器学习训练构建出情绪判断模型。将模型判断情绪的结果与主观判断情绪的结果进行对比,准确率达87.9%。证明机器学习可以实现对建模者文本阅读能力的模拟和复现。
分类: 工商管理学 >> 会计学 发布时间: 2025-04-14 合作期刊: 《会计之友》
摘要:【摘 要】 近年来,我国铁路货运企业的运营风险及其复杂程度不断上升,如何对其运营风险进行有效预防和管控是企业发展过程中亟待解决的问题。文章以A铁路货运公司为例,从公司主要运营环节业务流程出发,分析其运营过程中的关键风险点,以此为依托从调度、市场、合同、采购、应收账款、资金运营、运力、人力、研发及内控十大维度构建运营风险预警指标体系,同时基于公司近五年各维度运营数据,运用K-Means聚类与随机森林组合模型构建公司运营风险预警机制,通过参数调优和训练学习得到最优模型,并采用混淆矩阵及其二级指标评价该模型的有效性和泛化能力。结果表明预警准确率达到95.14%,AUC值为96.30%,预警效果良好。研究为铁路货运企业运营风险管控提出了合理化建议。
分类: 应用经济学 >> 金融学 发布时间: 2025-04-14 合作期刊: 《新金融》
摘要:自2020年以来,由于供应链中断和新冠疫情后的经济不确定性,预测通货膨胀已成为中央银行面临的一大挑战。机器学习模型可以通过纳入更广泛的变量、允许非线性关系以及关注样本外预测表现来提高预测准确性。在本文中,我们应用机器学习(ML)模型来预测日本近期的核心通胀率。日本是一个具有挑战性的案例,因为通胀在2022年之前一直处于低位,而现在已经上升到了四十年来前所未见的水平。我们对大量预测因子应用了四种机器学习模型以及两种基准模型。对于2023年,两种惩罚回归模型系统性地优于基准模型,其中LASSO提供了最准确的预测。2022年后预测通货膨胀的有效预测变量包括家庭通货膨胀预期、入境旅游人数、日元汇率和产出缺口。
分类: 公共管理学 >> 行政管理 发布时间: 2024-10-23 合作期刊: 《西北农林科技大学学报(社会科学版)》
摘要:失地农户作为城镇化过程中因征地拆迁而产生的特殊群体,其生计策略选择一直受到学者们的关注。为此,构建失地农户“生计资本-适应能力-制度环境-生计策略选择”的综合分析框架,利用西安市的调查数据,采用网络分析法(ANP),分析生计资本、适应能力、制度环境对失地农户生计策略选择的影响,并构建失地农户生计策略选择模型,在此基础上利用支持向量机(SVM)构建其应用模型。研究结果显示:(1)失地农户可选择的生计策略包括以农业种植活动为主、以个体经营为主、以外出打工为主和以获取工资性收入为主4种类型。(2)具有不同资本禀赋的家庭在生计策略选择方面存在差异,通过 ANP和 SVM 构建的模型可为失地农户的生计策略选择提供指导。
分类: 公共管理学 >> 行政管理 发布时间: 2024-11-13 合作期刊: 《公共管理与政策评论》
摘要:社会数字化的发展使得机器学习方法愈加受社会科学研究重视。尽管机器学习方法对 公共管理研究存在巨大价值,但该方法在现有公共管理文献中的运用仍相对有限。本文首先简要介 绍了机器学习方法的基本原理和操作方法,然后整理分析了近年来国内外公共管理顶尖期刊上所发 表文献中机器学习方法的具体应用,最后对该方法所面临的挑战和质疑进行了归纳和部分回应。本 文认为,机器学习在公共管理研究中既可以作为一种数据收集与整理的研究方法,又可以作为一种 数据分析的研究方法:首先,机器学习方法可以降低数据的收集成本,将非数值型数据转换为数值 型数据,也可以用于非数值型数据的聚类;其次,在相关性分析的公共管理研究中,机器学习可以 缓解 “维数灾难”,即变量数过多导致的多重共线性以及过拟合问题,从而分析变量之间的非线性 驱动作用;在因果推断类型的公共管理研究中,该方法主要用来分析异质性因果,但也可以结合其 他因果推断方法从而估计平均处理效应,解决工具变量法、倾向得分匹配法、断点回归法、双重差 分法和合成控制法在公共管理研究应用中所遇到的实践难题。然而,机器学习方法在实用易用性、 结果解释性、研究可复现性等方面同样遭受质疑,“决策不透明”的铁笼有时也会诱发违背公共精 神的风险。尽管如此,考虑到该方法潜在的巨大贡献,本文预计在公共管理研究中结合机器学习方 法将成为一种新的研究趋势。
分类: 政治学 >> 国际政治 发布时间: 2024-09-24 合作期刊: 《国际安全研究》
摘要:作者基于自然语言处理与机器学习,针对1950—2024年173例美国对外政策与行为,构造以ChatGPT为对象的行为实验与对照研究,涵盖美国制裁禁运、安理会否决、军事干涉、政权更迭、海外作战等五类事件。虽然目前大语言模型未在明面上被用于谋杀、军事破坏或系统性认知攻防与渗透,也没有大语言模型认知攻防作战公开明确的战略政策执行或文本宣示,但OpenAI的ChatGPT模型展现出显著的认知安全风险。这种认知威胁具有长期性、隐蔽性、精准性等特点,其潜在认知杀伤与认知“殖民”能力不容忽视。ChatGPT能够选择性呈现信息与伪造事实,并塑造、扭转用户认知与思维模式,引导用户产生对美国对外政策与行为正当性的积极情感,进而实现认知操纵。ChatGPT生成的内容在文本、叙事与情感等三个层面表现出正负面极化情感动员趋势,通过“言过其实”“无罪推定”“以退为进”等方式放大己方正当性、美化自身形象,通过“栽赃陷害”“无中生有”“有罪推定”污名化、妖魔化竞争对手形象。基于大语言模型的人工智能认知战成为一种隐蔽、精准、低成本、高收益的非动能作战工具。人工智能认知战利用人类的认知弱点和思维偏差,潜移默化地实施思维诱导与认知操纵,实现了“认知武器化”,对认知域国家安全构成了重大威胁。
分类: 工商管理学 >> 会计学 发布时间: 2025-03-26 合作期刊: 《财会月刊》
摘要:深度学习不仅拥有对半结构化和非结构化数据强大的信息识别能力,还能基于海量数据进行高效精准的预测分析和判断支持,这将极大地拓展审计证据范围,改善审计决策机制,有助于提升审计效率和审计质量。本文基于深度学习模型的信息识别功能和判断支持功能,将深度学习的智能分析与审计师的经验修正有效融合,不断扩充、更新、选代审计数据仓库,面向审计业务全流程,构建深度学习模型应用于审计业务不同阶段的集成性、整合性框架,以便更好地指导和推动深度学习模型和方法的审计应用。
分类: 应用经济学 >> 金融学 发布时间: 2025-03-26 合作期刊: 《国际金融研究》
摘要:我国脱贫攻坚战已取得全面胜利,然而如何巩固拓展脱贫攻坚成果仍是当前及今后需要面对的重要挑战。本文采用中国家庭追踪调查(CFPS)数据与数字普惠金融指标,通过理论与实证分析全面讨论了数字普惠金融与贫困脆弱性的关系,采用机器学习方法对数字普惠金融的“普及”和“惠及”作用进行了深入探讨。研究发现:数字普惠金融在总体上能减缓家庭贫困脆弱性的发生,通过分析覆盖广度、使用深度与贫困脆弱性间的关系发现,相较于“普及”效果而言,数字普惠金融发展带来的“惠及”效果更为突出。进一步通过异质性分析发现,“普及”作用在数字化程度较高地区的效果更好,而“惠及”作用在数字化程度较低地区效果更好。相较于沿海地区的青年群体而言,“普及”作用对沿海地区中老年群体的效果更好,而“惠及”作用则会对非沿海地区中老年群体效果更好。上述结论为理解数字普惠金融发展以及实现我国共同富裕目标提供了现实依据和政策启示。
分类: 信息资源管理 >> 情报学 发布时间: 2024-05-17 合作期刊: 《数字人文研究》
摘要:研究使用机器学习中的分类和聚类方法,基于自建平行语料库,考察哈代名作《德伯家的苔丝》中文三译本的翻译风格。从68个全部特征中筛选出15个显著特征,并结合实例进行量性融合的阐释和总结。结果表明,显著特征能够有效区分三译本风格差异,分类、聚类实验的平均准确率均达到97%左右,提示出各译本在词汇、句法、语篇上的不同风格特征和译者的个人偏好。研究在为既往质性研究提供数据支持和细粒度分析的同时,也提出了一些纠正性结论,如张谷若译本词汇密度更大、被字句比例极少、成语比例差别不大等,并为翻译风格和译者风格研究方法提供了一定改进和补充。
分类: 应用经济学 >> 产业经济学 发布时间: 2025-04-14 合作期刊: 《商业经济与管理》
摘要:经济学对市场竞争路径的学理性分析,主要集中在价格确定、产量确定、规模经济、产业组织等方面,而对科技进步引发市场竞争路径的变化并没有足够的关注。其实,市场竞争路径变化的底蕴是科技进步,只是经济学家在分析市场竞争路径时偏好于将科技因素作为外生变量处理。大数据和人工智能等的发展可谓是一场史无前例的科技革命,它对人类经济活动产生广泛而深刻的影响主要表现为:大数据及其运用怎样影响厂商投资经营,大数据与机器学习等人工智能手段相融合会在哪些方面改变厂商竞争路径,厂商如何提高数据智能化和实现网络协同化,在什么样的条件下会出现行业垄断,等等。文章的基本分析观点是:厂商竞争路径变化是贯穿于大数据、互联网和人工智能等相互融合过程的一种现象,这种现象对应于新科技进步和运用的不同层级;微观经济分析需要将新科技因素作为内生变量,通过分析大数据、机器学习与厂商竞争路径之间的关联,揭示厂商竞争路径变化机理以及由此引致的产业组织等问题。
分类: 应用经济学 >> 金融学 发布时间: 2025-03-26 合作期刊: 《国际金融研究》
摘要:防控信用债的流动性风险关系到防范系统性金融风险和维护国家安全,其核心在于对风险进行有效测度和预警。本文采用2009年1月一2020年12月的中国信用债月度数据,通过尾部相关性测度信用债流动性风险,从融资约束、信用风险和噪声交易角度构建预警风险因子体系,并采用神经网络等包含11种设定的机器学习模型,预警信用债流动性风险并识别重要风险因子的作用机理。研究表明:第一,包含一层隐含层的神经网络对信用债流动性风险的预警能力最强,在不同类型债券和不同外部环境的样本中预警能力的稳定性较强,能准确预警市场层面的流动性枯竭事件;第二,券龄的重要性最高,新发行的债券会通过引发噪声交易的方式形成流动性风险,但随着券龄增加,流动性风险减少的程度是递减的;第三,流动性风险是由多类风险因子协同运动生成的,其中,经济状况变动、货币政策改变或跨市场冲击与券龄的非线性联动对于驱动流动性风险最为重要。
分类: 应用经济学 >> 国际贸易学 发布时间: 2025-04-03 合作期刊: 《经济理论与经济管理》
摘要:本文利用中国各地级市政府工作报告和机器学习方法测度了数字化政府建设指数,并考察了数字化政府建设对出口结构升级的影响。研究表明,数字化政府建设有利于推动出口结构升级,系列因果推断及稳健性检验均验证了该结论可靠。异质性分析表明,数字化政府建设能够跨越“数字鸿沟”助力出口结构升级,且对中西部地区和人口红利薄弱地区的影响更大。机制分析表明,数字化政府建设通过创新驱动效应、进口中间品种类扩张效应和全国统一大市场效应推动出口结构升级。此外,数字化政府建设能够通过促进资源在城市间再配置及产品新增消亡推动出口结构升级。拓展分析表明,智慧城市建设能够与数字化政府实现有效联动,共同助力中国出口结构升级。
分类: 应用经济学 >> 产业经济学 发布时间: 2025-04-09 合作期刊: 《经济理论与经济管理》
摘要:面对一二三线城市房价增速的分化走势,“因城施策”逐渐成为主基调,为此需要准确识别不同城市房价分化的主要因素。本文综合使用XGBoost等机器学习方法以及SHAP值解释性方法,基于2009一2019年全国70个大中城市面板数据,测算并分析一二三线城市房价分化的主要因素。结果表明:(1)预期因素在多轮房价分化期间都起到重要驱动作用;(2)货币政策本身并不是房价分化的主要因素,但可以通过影响预期导致房价分化;(3)需求因素和供给因素本身也不是房价分化的主要因素,但也可以通过影响预期导致房价分化。有鉴于此,“因城施策”的关键在于稳定公众对房价的预期:一线城市应在控制土地成本的前提下适当增加住房供给,削弱由于供不应求所带来的房价上涨预期;二三线城市需进一步完善基础设施,提高教育、医疗和环境质量,改善居民购房需求,防范人口外流带来的房价下跌预期。
分类: 工商管理学 >> 会计学 发布时间: 2025-04-03 合作期刊: 《会计之友》
摘要:文章提出了一个创新的利润健康评估理论模型,该模型通过融合信号传递与代理理论,结合财务与非财务指标,从四个不同维度对上市公司的盈余质量进行综合评估。此模型超越了传统的盈余管理分析框架,专注于揭示上市公司的整体盈余状态,旨在解决信息不对称和管理层动机问题。选取2018—2022年中小板民营企业作为分析对象,并基于机器学习算法验证了模型的有效性。通过应用此模型,识别出在2018—2023年间被证监会处罚的中小民营企业中,有85.7%的样本处于利润健康的较低水平,这一发现进一步加深了监管机构和投资者对上市公司盈余健康状况的理解。利润健康评估模型不仅丰富了盈余管理的理论基础,为监管者和市场参与者提供了一种全新的评估工具,也为将来在不同市场和行业中应用此模型,以及重新审视盈余质量评估方法提供了新思路。
分类: 工商管理学 >> 会计学 发布时间: 2025-02-21 合作期刊: 《财会月刊》
摘要:上市企业内部控制缺陷信息是企业利益相关者进行决策的重要参考,人为操纵内部控制缺陷认定以及错误披露内部控制缺陷信息会引发企业未来的经营风险。基于机器学习算法构建的预测模型能够对企业的内部控制缺陷进行有效预测,有助于企业对潜在风险进行预警。实证研究表明:与判别分析、逻辑回归、支持向量机、决策树等利用机器学习算法预测企业内部控制缺陷的模型相比,随机森林模型在预测的准确率、精准率、召回率、F1-score和AUC值方面综合表现更好。在使用随机森林模型预测企业内部控制缺陷的过程中,审计费用、机构投资者持股比例和总资产增长率等特征变量起到了重要预测作用。进一步采用SHAP方法对特征变量进行贡献分布可视化分析,深度挖掘特征变量对企业内部控制缺陷出现的影响机理。
分类: 工商管理学 >> 会计学 发布时间: 2025-03-12 合作期刊: 《会计之友》
摘要:ChatGPT-4的进步技术,特别是情感分析和关键字提取功能,对于构建针对市场的GPT-ESG评估框架起到了关键作用。本项研究应用ChatGPT-4的文本情感分析能力,对A股市场上市公司的公开报告进行了深入研究,这些报告包括但不限于可持续发展报告、ESG报告和财务报告中专注于分析公司治理、环境保护以及社会责任方面的内容。研究结果显示,ChatGPT-4生成的数据与国内三大评级机构的标准化评级结果高度相关且差异较小。通过运用ChatGPT-4技术对A股上市公司进行客观而高效的评级,不仅促使企业提供更加公正的报告,还为投资者在评估公司的环境、社会和治理(ESG)实践以及投资决策方面提供了重要支持。这一研究成功展示了ChatGPT-4在金融领域应用的潜力,特别是在促进公平、透明的企业评估方面的重要作用。