Page 121 - 201909数码世界9.9
P. 121
科技交流
操作简单,考虑到《中国分类主题词表》需要维护变动, 本文资源标注主要分为三个阶段完成,分别是初始关联确
我们对标签库进行单独存储,从而便于对标签库进行修改。 定、关联程度值处理和关联程度值更新。 初始关联确定阶段主
实用性强,本体构建工具 Protégé 是基于 Java 语言开发的 要由学科老师根据以往的教学经验分析教学资源并给出与教学
开源本体编辑和知识获取软件,可以免费下载,并且具有良好 资源相关的知识点以及相应的相对关联程度。关联程度值处理
的扩展性,更为可贵的是它支持中文的输入,具有很强的实用性。 阶段主要是利用层次分析法对初始标注结果进行处理,获得资
因此,本文选用 Protégé4.2[9] 作为本体开发工具用来构建标 源与相关知识点的关联程度值。在完成资源标注后,还需要对
签库。 资源标注信息进行维护更新以保持标注信息的准确性以及稳定
2.2 标注信息表示 性,关联程度值增量更新阶段是系统根据用户评价增量完成关
定义 2 这里将标注信息 (Information of Annotation, 联程度值的更新。
IA) 定义为一个三元组,IA=(R,L,β)。其中,R 代表学习资源, 3.2.1 初始关联确定
实际上是资源的抽取信息;L 代表标注标签,即是由领域本体 由多位领域专家对学习资源进行分析,判断矩阵指标评分
抽取出的元知识点;β 代表标签 L 与该资源 R 的关联程度。标 标准标示出与资源相对应的知识点,然后综合领域专家的初始
注信息即资源标注的结果,标注信息表示是决定资源标注成功 标注,获得与资源相对关联程度最大的若干个知识点作为资源
与否的关键因素。标注信息按保存形式分为内嵌式和非内嵌式 的 标注标签并依照相对关联程度进行排序,进而可以获得资源。
两种,其中内嵌式是把标注信息作为本体内容一起存储,而非 3.2.2 关联程度值处理
内嵌式是把标注信息独立存储于数据库中。由于学科知识具有 本文采用层次分析法来处理关联程度值,重点是如何构建
相对不变性,也就意味着知识本体不需经常维护,而教育资源 阶梯层次结构。这一步需要认真分析资源与标签的关联确定问
需要根据实际情况进行经常性的增删改查。因此,本文标注信 题,充分考虑问题的影响因素,根据层次分析法原理构造如下:
息选择非内嵌式的保存形式具有以下三个方面好处: 第一层:目标层只有一个元素,就是问题的实现目标,即确定
1)可以减少对标签库的操作,保持标签库的稳定性,节省 资源与标签的关联程度值。
部分不必要的系统开销。 第二层:准则层包括所有实现目标所涉及的资源与标签关
2)在教育资源改变时,不需要对标签库进行操作与维护,只 联程度的评价问题,考虑到不同领域专 家的知识深度及广度的
需对标注信息库进行相应的增删修改即可,可减少系统的维护开 差异性,由此考虑以不同领域专家作为准则层。
销。 第三层:方案层包括实现目标的方案,即与资源相关的标
3)在进行资源标注时,由于不需要针对标签库和资源本身 签的确定。
进行操作,可以很容易地实现跨媒体资源标注。 3.2.3 关联程度值增量更新
2.3 多标签资源标注 在资源使用过程中,需要对资源标注信息时时维护以保证
之前学者研究的资源标注方法都是单一标签标注,然而很 资源标注信息的准确性。这就要求系统能够定期对用户投诉较
多资源并不是仅关于单一主题的,这就使得在使用单一标签标 多的资源重新进行标注并对资源标注信息进行更新,由此本文
注资源时不能充分描述资源信息而造成资源信息的丢失。为解 提出了关联程度值增量 AHP 更新方法。
决这个问题,本文提出了学习资源多标签资源标注模型。多标 首先,邀请新一批领域专家针对该资源 Rk 进行初始标注,
签标注模型就是利用多个知识点作为标签去标注同一个资源, 获得资源 Rk 的 C-P 判断矩阵 E’。 然后,分析比较历史标注
从而尽可能准确完整的描述资源信息。在对资源完成标注之后, 权向量与重新标注权 向量的差异,可得出权向量增量值, 其
即在标注信息库中构造了该资源的标注信息组。 中 β’k 为更新后的权向量。最后,在构建更新规则的过程中,
3 基于增量 既要考虑到重新标注的信息,也要考虑历史标注信息。
AHP 的多标签标注方法学习资源多标签标注模型建立后, 4 结束语
一个重要的问题是如何确定关联程度值。对于某一学习资源, 本文提出的基于增量 AHP 的学习资源多标签标注方法同时
可能包含的多个标签与资源的关联程度值可能不同,而且随着 考虑了资源的多关联性以及标签贡献度的问题,很好地解决了
资源信息的丰富,关联程度值也需要进行更新维护。基于以上 资源标注过程中信息丢失的问题,同时完成了对学习资源的精
问题,本文提出了基于增量 AHP 的多标签标注方法。 确标注,能够使用户快速准确地检索到所需的资源,从而可以
3.1 层次分析法 极大地提高用户的检索效率。进一步的研究中,我们将会深入
层次分析法(AHP 方法)是美国著名运筹学家 T.L.Saaty[10] 研究并改进增量更新算法并在资源标注中尽可能的减少主观因
提出的一种定性分析与定量分析相结合的系统分析方法,它充 素对关联程度值的影响。
分利用了人的分析、判断和综合能力,能够有效分析目标准则
体系层次间的非序列关系 , 有效地综合测度决策者的判断和比 参考文献
较。 [1]Tim Berners-Lee, Hendler James and Ora Lassila. The
层次分析法的基本思想是:首先根据多目标评价问题的性 Semantic Web [J]. Scientific American, 2001, 284(5):28-37
质和总目标将复杂的问题按层次进行分解,形成阶梯层次结构, [2] 张沪寅 , 张铭洋 , 李鑫 . 基于领域本体的电子学习资源库
通过两两比较的方式确定层次中影响因素的相对重要性,然后 模型 [J]. 计算机应用 ,2012,32(1):191-195
综合领域专家的主观判断,对层次结构中影响因素的相对重要 [3] 张沪寅 , 李鑫 , 陆春涛 , 等 .LMOD: 一种基于本体描述的电
性进行排序。 子学习资源库模型 [J]. 计算机应用研究 , 2011,28(4):1001-
3.2 基于增量 AHP 的学习资源多标签标注 3695
124... ...125