Page 121 - 201909数码世界9.9
P. 121

科技交流

                   操作简单,考虑到《中国分类主题词表》需要维护变动,                             本文资源标注主要分为三个阶段完成,分别是初始关联确
                我们对标签库进行单独存储,从而便于对标签库进行修改。                           定、关联程度值处理和关联程度值更新。 初始关联确定阶段主
                   实用性强,本体构建工具 Protégé 是基于 Java 语言开发的                要由学科老师根据以往的教学经验分析教学资源并给出与教学
                开源本体编辑和知识获取软件,可以免费下载,并且具有良好                          资源相关的知识点以及相应的相对关联程度。关联程度值处理
                的扩展性,更为可贵的是它支持中文的输入,具有很强的实用性。                        阶段主要是利用层次分析法对初始标注结果进行处理,获得资
                因此,本文选用  Protégé4.2[9] 作为本体开发工具用来构建标                 源与相关知识点的关联程度值。在完成资源标注后,还需要对
                签库。                                                  资源标注信息进行维护更新以保持标注信息的准确性以及稳定
                2.2 标注信息表示                                           性,关联程度值增量更新阶段是系统根据用户评价增量完成关
                   定义 2 这里将标注信息 (Information  of  Annotation,        联程度值的更新。
                IA) 定义为一个三元组,IA=(R,L,β)。其中,R 代表学习资源,                 3.2.1 初始关联确定
                实际上是资源的抽取信息;L 代表标注标签,即是由领域本体                             由多位领域专家对学习资源进行分析,判断矩阵指标评分
                抽取出的元知识点;β 代表标签 L 与该资源 R 的关联程度。标                     标准标示出与资源相对应的知识点,然后综合领域专家的初始
                注信息即资源标注的结果,标注信息表示是决定资源标注成功                          标注,获得与资源相对关联程度最大的若干个知识点作为资源
                与否的关键因素。标注信息按保存形式分为内嵌式和非内嵌式                          的 标注标签并依照相对关联程度进行排序,进而可以获得资源。
                两种,其中内嵌式是把标注信息作为本体内容一起存储,而非                          3.2.2 关联程度值处理
                内嵌式是把标注信息独立存储于数据库中。由于学科知识具有                              本文采用层次分析法来处理关联程度值,重点是如何构建
                相对不变性,也就意味着知识本体不需经常维护,而教育资源                          阶梯层次结构。这一步需要认真分析资源与标签的关联确定问
                需要根据实际情况进行经常性的增删改查。因此,本文标注信                          题,充分考虑问题的影响因素,根据层次分析法原理构造如下:
                息选择非内嵌式的保存形式具有以下三个方面好处:                              第一层:目标层只有一个元素,就是问题的实现目标,即确定
                   1)可以减少对标签库的操作,保持标签库的稳定性,节省                        资源与标签的关联程度值。
                部分不必要的系统开销。                                              第二层:准则层包括所有实现目标所涉及的资源与标签关
                   2)在教育资源改变时,不需要对标签库进行操作与维护,只                       联程度的评价问题,考虑到不同领域专 家的知识深度及广度的
                需对标注信息库进行相应的增删修改即可,可减少系统的维护开                         差异性,由此考虑以不同领域专家作为准则层。
                销。                                                       第三层:方案层包括实现目标的方案,即与资源相关的标
                   3)在进行资源标注时,由于不需要针对标签库和资源本身                        签的确定。
                进行操作,可以很容易地实现跨媒体资源标注。                                3.2.3 关联程度值增量更新
                   2.3 多标签资源标注                                           在资源使用过程中,需要对资源标注信息时时维护以保证
                   之前学者研究的资源标注方法都是单一标签标注,然而很                         资源标注信息的准确性。这就要求系统能够定期对用户投诉较
                多资源并不是仅关于单一主题的,这就使得在使用单一标签标                          多的资源重新进行标注并对资源标注信息进行更新,由此本文
                注资源时不能充分描述资源信息而造成资源信息的丢失。为解                          提出了关联程度值增量 AHP 更新方法。
                决这个问题,本文提出了学习资源多标签资源标注模型。多标                              首先,邀请新一批领域专家针对该资源 Rk 进行初始标注,
                签标注模型就是利用多个知识点作为标签去标注同一个资源,                          获得资源 Rk 的 C-P 判断矩阵 E’。  然后,分析比较历史标注
                从而尽可能准确完整的描述资源信息。在对资源完成标注之后,                         权向量与重新标注权  向量的差异,可得出权向量增量值,  其
                即在标注信息库中构造了该资源的标注信息组。                                中 β’k 为更新后的权向量。最后,在构建更新规则的过程中,
                3 基于增量                                               既要考虑到重新标注的信息,也要考虑历史标注信息。
                   AHP 的多标签标注方法学习资源多标签标注模型建立后,                       4 结束语
                一个重要的问题是如何确定关联程度值。对于某一学习资源,                              本文提出的基于增量 AHP 的学习资源多标签标注方法同时
                可能包含的多个标签与资源的关联程度值可能不同,而且随着                          考虑了资源的多关联性以及标签贡献度的问题,很好地解决了
                资源信息的丰富,关联程度值也需要进行更新维护。基于以上                          资源标注过程中信息丢失的问题,同时完成了对学习资源的精
                问题,本文提出了基于增量 AHP 的多标签标注方法。                           确标注,能够使用户快速准确地检索到所需的资源,从而可以
                3.1 层次分析法                                            极大地提高用户的检索效率。进一步的研究中,我们将会深入
                   层次分析法(AHP 方法)是美国著名运筹学家 T.L.Saaty[10]              研究并改进增量更新算法并在资源标注中尽可能的减少主观因
                提出的一种定性分析与定量分析相结合的系统分析方法,它充                          素对关联程度值的影响。
                分利用了人的分析、判断和综合能力,能够有效分析目标准则
                体系层次间的非序列关系 , 有效地综合测度决策者的判断和比                        参考文献
                较。                                                   [1]Tim  Berners-Lee,  Hendler  James  and  Ora  Lassila.  The
                   层次分析法的基本思想是:首先根据多目标评价问题的性                         Semantic Web [J]. Scientific American, 2001, 284(5):28-37
                质和总目标将复杂的问题按层次进行分解,形成阶梯层次结构,                         [2] 张沪寅 , 张铭洋 , 李鑫 . 基于领域本体的电子学习资源库
                通过两两比较的方式确定层次中影响因素的相对重要性,然后                          模型 [J]. 计算机应用 ,2012,32(1):191-195
                综合领域专家的主观判断,对层次结构中影响因素的相对重要                          [3] 张沪寅 , 李鑫 , 陆春涛 , 等 .LMOD: 一种基于本体描述的电
                性进行排序。                                               子学习资源库模型 [J]. 计算机应用研究 ,  2011,28(4):1001-
                3.2 基于增量 AHP 的学习资源多标签标注                              3695


                   124...                                                                                                                                                                                                                ...125
   116   117   118   119   120   121   122   123   124   125