个性化信息需求实证研究
主讲:曹树金
时间:2009年5月20日
整理:付跃安
首先非常高兴有这个机会,我今天向大家汇报的是我所做过的一个项目的部分内容,获得省社科基金资助。汇报的基本内容包括:研究背景、研究问题、理论基础、研究方法、问卷设计、调查结果、结论,这也是一个完整的研究结构。
一.研究背景与研究问题
首先是为什么要做这个研究,或图书馆界为什么要考虑这个问题?主要原因是目前有这方面的需求,也有这方面的技术支持。首先,因特网带来的信息爆炸导致了两个现象,一个是信息过载,一个是资源迷向。信息过载指用户面对主动送上门或已下载的信息难以及时地消化、吸收。最近国外有一个概念叫“信息贫困”,包括需要的信息不能获得,也包括信息太多了,不知道哪个是有用的。另外一个现象是“资源迷向”,指用户不知道如何确切地表达自己的信息需求,也不知道如何准确有效的寻找资源。在满足用户信息需求时,用户不能很好地表达出到底需要什么,因此也就不知道去哪里寻找,或查找哪些信息,致使信息服务机构包括图书馆要想办法既满足用户意识到的需求,也要满足用户没有意识到的需求或意识到但没有表达出来的需求,这就要个性化的信息服务。1999年1月,美国图书馆与信息技术协会在预测信息技术在图书馆的应用发展趋势中提到有七个趋势,第一个就是个性化信息服务应成为图书馆的发展趋势之一。从那之后,无论国内还是国外,图书馆界对个性化服务的研究就逐渐多了起来,特别是在我国,近几年关于个性化服务在杂志上发表的文章很多。但这些研究有个普遍存在的问题,即读者到底要不要这样的服务,除了理论上的推理外,有多少需求,国内外都缺少具体的回答,特别是在国内。我们的研究就是要试图回答这个问题。个性化服务理论上来说是很重要的,对于图书馆或信息服务机构来讲,如果做得好,可以更好地满足用户的需求,也能更好地提升信息服务机构的价值。本课题试图通过调查和统计分析来回答以下四个问题:①用户需要哪些个性化服务:个性化服务的内容不是单一的,而是多样化的,到底哪些是读者需要的;②用户需要什么样的个性化信息服务:个性化信息服务可以是这样的,也可以是那样的,用户到底需要哪一种;③用户需要什么程度的个性化服务;④个性化服务需求受到哪些因素的影响:有的人需要,有的人不需要,有的人需要强烈,有的人需要不强烈,是什么因素导致读者中哪一部分群体需要,哪一部分群体不需要,哪一部分群体需要得多,哪一部分群体需要得少,个性化的服务需求会受到哪些因素的影响。
二. 理论基础
1.定义
结合其他研究者对个性化服务的定义,我给出了自己的界定,即:图书馆个性化服务指图书馆在数字信息环境中,主要利用网络和信息技术,获取并分析各用户的信息使用习惯、偏好、背景和要求,从而为用户提供充分满足其个体信息需要的一种集成性信息服务。这里有好几层意思。首先,只有具备大量的数字信息,个性化服务有可能,其次,服务的送达主要是利用网络进行的,离不开网络与信息技术,第三,信息服务怎么能够个性化,要分析每一个用户的信息使用习惯、信息偏好、背景和要求。我们以前的服务没办法具体到个人,如图书馆读者研究,研究对象可以是学生、教师、工人、干部等,像消费市场细分一样,只能是一群一群的,不能针对个体进行研究和提供服务。个性化就是要了解每一个人的需求,并以此为据来提供满足其个性需求的集成性信息服务。
2.与相关概念的区别
之所以下这个定义,是因为国内学界在研究个性化服务的时候,人们的看法往往存在着误区,最典型的就是同以前的概念混淆。
①个性化服务与个别服务、重点服务。个别服务与重点服务以前就有,个性化服务与它们是完成相反的意思,但有些人将它们混在一起。个别服务与重点服务是在大的读者群中挑出少数读者提供专门服务,而个性化服务主要是针对全体读者或大多数读者中的每一个人,这是个性化的精隨所在。
②个性化服务与定题服务。定题服务出现得比较早,在计算机用于信息提供之后就有了,一直到现在。有的人说,个性化服务就是定题服务的延伸。定题服务同个性化服务比较接近,但并非完全相同。需要特别强调的是,定题服务不属于完全意义上的个性化服务,因为在定题服务中,只要确定了一个主题,不论是什么人,只要题目相同,提供的信息就是相同的,但个性化信息服务强调用户的不同,哪怕确定的是相同的需求和检索课题,最好能提供符合个人要求的信息,应为不同的用户提供不同的信息。
③个性化服务与定制服务。定制服务在电子商务环境中经常提到,在信息服务中也有定制服务。有的人将个性化服务等同于定制服务,其实两个概念有关联,但不完全相同,或者说定制服务只是个性化服务的一部分,即有些个性化服务是定制服务,有些个性化服务不是定制服务。
④个性化服务与特色服务。特色服务在图书馆界讲了很多年,指某个图书馆提供的服务是别的图书馆不提供的,是从服务提供者的角度来讲的,而个性化服务是针对接受服务的人来说的,它跟特色服务不太相关,但有人认为个性化服务就是特色服务,将两者混淆。
通过这几个比较可以看出来,个性化服务是在新的环境、时代和条件下产生的一种更加人性化的服务,一种更加考虑每一个个体的服务。
3. 个性化服务的特点
个性化服务的特点可以归纳为以下几个方面:首先是以用户个体需要为导向,以对用户个体知识结构的了解为基础。个性化服务首先要知道某个具体的人,他的知识结构怎样,他已经掌握了什么,没有掌握什么,需要什么,这在以前是不可能了解到的。其次,个性化服务是一种更充分满足用户需求的多样性和集成性的服务,个性化服务包括不同种类的服务,它要求提供一种集成的服务。第三,个性化服务以网络化、自动化、数字化服务为主,以网下、人工、非数字信息服务为辅。第四,个性化服务既有主动服务,又有被动服务。信息服务机构提供个性化服务,既可以信息机构主动,也可以读者主动,两者都有,只不过原来提供的服务大都是被动的,即当读者提出需要时才提供服务,除了这种图书馆被动、读者主动的服务外,在个性化服务中也包含着图书馆主动、读者被动的情况。
4. 图书馆个性化服务的方式
图书馆个性化服务最主要的方式是个性化的信息推送,即根据用户的兴趣和特点向用户推荐感兴趣的信息,可以是用户定制后推送,也可以是系统分析用户的需求偏好后主动推送。第二个服务方式是个性化检索。图书馆检索系统存在已经很久了,在现有的检索系统中如果需要增加个性化服务,就要对原有系统做些改进。个性化检索要根据用户的需求特点进行检索,返回与用户需求相关的,甚至是高度相关的检索结果,其基本思想就是满足特定用户的特定需求,是一种体现个性化特征、满足个性化需求、培养个性化趋势的信息检索方法。在传统的检索系统中,不同的人输入相同的检索提问,检索结果是一样的,而个性化的检索系统应为每个用户提供不一样的东西,这就需要系统进行判断,要推断检索人的背景和具体要求。另外一种服务方式是个性化的网站。目前许多图书馆都开通了自己的网站,同读者的交流除了面对面的交流外,还需要通过网络进行。对于传统的图书馆网站,所有的人打开后看到的东西都是一样的,但对于个性化网站,允许不同的人打开的网站是可以根据自己的要求设置的。
5.个性化服务模式
图书馆个性化服务的主要模式是MyLibrary,在很多早期图书馆集成系统中一般都镶嵌有这一功能,现在的集成系统在这一功能上出现了一些变化。
三.研究方法
我们的研究属于实证研究,首先通过问卷收集数据,然后对收集的数据进行统计分析,我们采用了最流行的SPSS Statistic 17.0统计软件进行分析,利用了描述性统计分析、交叉分析、相关分析、独立样本T检验、单因子方差分析、Tukey HSD多重比较等统计方法。
四. 问卷设计
问卷是本课题中用来收集数据的主要工具,根据要研究的问题和国内外的相关研究,依据个性化服务理论以及国内外已经开展的个性化服务现状和对发展趋势的预测,本课题设计的问卷共包括七个部分:被调查者的基本信息、被调查者的图书馆使用行为和网络使用行为、用户个性化兴趣与需求建立方式、对图书馆个性化服务门户的需求、对图书馆个性化服务工具的需求、个性化隐私保护的需求。在设计问题的时候主要采用五点量表,即一个问题的回答有五个刻度,五是最高级,一是最低级。第一部分用于了解用户的人口统计学特征,包括性别、年龄、身份、受教育程度等,第二与第三部分用于了解用户的生活方式,包括图书馆的使用行为和网络使用行为,目的是方便后面的分析,因为用户使用图书馆程度与使用网络程度不一样,对个性化服务的需求也是不一样的。第四、五、六部分是本调查的主体。第四部分用来调查用户个性化兴趣与需求建立的方式,因为要提供个性化服务,就要了解每一个个体的兴趣、需求和背景以及用户表达个性化需求的途径,特别是读者对图书馆常用的分类定制和主题定制的愿意。第五部分是调查用户对个性化门户的需求,即图书馆同读者在网上交互时需要提供哪些功能,如个性化的信息环境和服务功能、个性化的推荐和检索功能等。第六部分调查用户对个性化信息服务工具的需要。目前信息技术的发展很快,个性化信息服务有了专门的工具,对图书馆读者而言,这些工具是否会受到欢迎,需要通过调查进行了解。第七个部分关于隐私保护问题。个性化服务需要掌握每个人的信息,并以此为依据提供服务,读者是否愿意将自己的信息提供给图书馆,或提供给图书馆以后,他希望得到何种保护,也需要通过调查来了解。
五.调查结果
1. 样本特征
本次研究共回收有效问卷572份,广州图书馆也帮忙回收了不少,调查对象覆盖了高校图书馆、公共图书馆和科技图书馆三大类型图书馆的用户。由于纸质问卷主要在广州地区发放,因此调查对象主要是广州地区的用户,另外通过网络调查获得20几份问卷,网络问卷的回答者主要来自外地。在572份问卷的回答者中,女性占一大半,即53.8%,男性占46.2%;调查对象中年龄分布以35岁以下的年轻人为主,其中18-25岁最多,占74.1%,18岁以下的占2.1%,36-50岁的占3.8%,50岁以上的比较少,仅占1%;调查对象的身份分布中学生是最多的,占76.6%,公司与企业员工占7.2%,老师(包括高校与中小学老师)占5.9%,科研人员占2.8%;调查对象的受教育程度,大部分被调查者是本科,占67.7%,包括在读学生和已经毕业的,其它教育程度的人员相对少一些。
2. 个性化服务使用情况
在调查中,将近一半的用户回答使用过个性化服务,但使用的不一定是图书馆的个性化服务,其中使用最多的是搜索引擎或由门户网站提供的,如Google的iGoogle有102个人用过,MSN的My MSN有67个人用过,Yahoo的My Yahoo有47个人用过。电子商务网站提供的个性化服务也有较多用户使用。使用过图书馆的MyLibrary的用户数量比较少,只有21位。另外,图书馆提供的数据库也有不少具备个性化服务功能,但是使用的很少,象PubMed提供的My ncbj、Apabi电子图书提供的个性化服务、BIOSIS Previews提供的个性化服务、超星电子图书馆提供的个性化服务均只有1人用过,等于几乎没人用。这也是我们开展调查的一个起因,因为图书馆经常说个性化功能很重要,读者也说很重要,可是图书馆提供的这些东西,为什么读者不用?Web2.0与图书馆2.0近年来在图书馆界炒得很热,也发表了不少文章,但使用情况如何?调查显示,使用比例还是比较高的,有69.8%的用户使用过Web2.0,其中18-25岁的年轻用户最多,达到71.5%。在读者所使用的Web2.0的各项服务中,博客使用得最广泛,占74.6%,其次是社会性网络服务(SNS),占19.3%,还有播客、维基、RSS、社会书签工具。
3.表达方式
用户希望最多的是主题定制,即通过提供主题词或关键词,告诉系统读者需要什么,系统再根据读者的需要提供资料,对该项功能的需求程度达到54.5%;而51.6%的用户希望“系统根据你的使用记录和使用行为,推导您的兴趣与需求”,只要读者用过某个系统,系统就把读者的使用经历记录下来,然后根据读者使用的情况来推论读者对什么感兴趣,需要什么,处于何种水平,应提供什么样的信息;45%的用户希望通过分类进行定制,即读者告诉系统需要哪一类或哪几类信息;40.9%的用户希望系统根据类似用户的使用记录和使用行为为自己推导信息需求。在商业网站,如果用户查找了某种商品,系统就会告诉用户其他查过这个商品的人同时也查了什么或买了什么,将这种方法转移到图书馆就是:如果读者找了一本书或查了一篇文章,系统就会告诉读者,找过这本书的读者也曾经找过哪些书,查过这篇文章的人也曾经查过哪些文章或信息。通过以上数据可以看出来,用户对需求的表达其实不是很集中的,不同的人有不同的选择,之间差得不是太多,即每一种个性化信息需求表达方式都有人愿意使用。
图书馆分类信息组织和分类信息提供是一种重要的信息提供方式。在个性化服务中,虽然一般人认为,分类定制的时候,类目层次越深,定制的效果越好,例如如果系统只能为读者定制《中图法》的22个大类,读者每天一打开电脑就会接受很多被推送过来的信息,但这些信息肯定不会都是读者所需要的,因此似乎精确一点,效果会好一些。但调查结果很分散,没有倾向性。26.9%的用户希望“从最粗到最细类目间任选”,例如在《中图法》的一级类到十级类之间,用户定制十级类系统就提供十级类的信息,用户定制二级类系统就提供二级类的信息。现在的MyLibrary,大部分提供的是一级类定制,但仍有24.5%的用户希望获得一级类定制。三级类目的定制比例为25%,二级类目的定制比例为22%。这些调查说明,读者在选择定制类目的级别时没有很明显的倾向性,但至少有一点,即如果图书馆的新书推荐系统只给用户提供一级类目定制,显然满足不了大部分用户的要求。更进一步了解,如何确定所定制的类目,48%的用户希望提供可以展开的分类表,然后由读者从中选择,42%的用户希望通过输入一个分类号或类目名称,系统根据所输入的信息推荐候选类目和类目名称,只有10%的用户愿意“自己输入分类号或类目名称”。由此可以看出,大部分人希望在进行分类定制的时候系统提供某种程度的帮助,而不是仅提供一个个的方框,由读者往里面写信息。
在有关主题定制的调查问题中,我们给出了三个选择:关键词、自然语词、规范主题词。调查结果在预料之中,大部分人选择使用关键词进行定制,也有40.2%的人愿意三者都用,单独选择自然语词和规范主题词的比例较低,均为10%以下。对于用来表达个性化兴趣与需求语词的数量,43.6%%的人希望用三个词来表达个人的信息需求,25.2%的人希望用两个词,13.5%的人希望用四个词,17.7%的人希望用一个词。这一调查结果和实际观察或检索日志分析的结果有些出入。通过搜索引擎调查我们发现,绝大部分人只用一个词或两个词进行检索,使用三个词以上的人很少,因此可以得出,希望与实际操作的结果是有些差距的。
5.个人信息提供意愿
除了提出自己的要求外,系统还要根据个人信息推断读者的需要,因此就要求读者提供自己的信息。结果显示,89.5%的用户同意或非常同意“我愿意为使用个性化服务而在使用的时候登陆”,这个比例算是比较高的,因为在登陆的过程中,读者提供的信息不是太多,如仅提供借书证号。74.8%的用户同意或者非常同意“我愿意为享受个性化服务而注册”,比例相对较低,因为在注册的时候提供的个人信息要多一些。当问及是否愿意提供本人真实、准确的信息时,比例一下子降了下来,不到一半的人同意或非常同意,意味着在进行个性化服务注册的时候,有一半的人提供的信息不是那么真实的,表明公众对提供个人的隐私信息不放心。在读者愿意提供的个人信息中,电子邮件是最多的,占回应此用户数的90.5%,即在注册的时候告诉系统邮箱地址,系统将读者需要的资料直接发送到邮箱中。关于年龄、性别等更为具体的信息,读者是不太乐意提供给系统的。根据上述调查结果可以得出,结合用户个性化兴趣与息需要的表达方式和用户个人信息提供意愿来看,用户为获得个性化信息服务愿意付出一定的努力,但是这种努力并不多,即如果比较麻烦,用户宁可不要这种服务。
6.个性化信息需求环境
调查结果显示,用户对个性化信息环境总体倾向于需求,平均需求程度达到3.87。调查表采用的是5点刻度,最高值是5,国外的统计分析中有一个判断标准,即当使用1到5的刻度进行调查时,如果平均得分达到3.5,结果就比较肯定。除了个性化信息环境整体需求之外,我们还分别进行考察,排在第一位的问题是“当你登陆个性化信息环境后,就可使用个性化信息环境中所有的电子资源(数据库、电子期刊等),而不用在每使用一项资源时都需重新登陆”,用户的平均需求程度高达4.2,这一点与国内外的相关研究结果一致。图书馆购买了许多数据库,但读者每使用一次就要登陆一次,这个对读者是很烦的,如果能够一次登陆,登陆之后其他需要登陆的地方都不用登陆,就会极大地方便读者。结果表明,用户对单点登陆、统一检索的需求是非常强烈的。排在第二位的问题是关于个性化信息空间收藏夹的功能,即读者可以将在网上检索到的内容保存在其中,平均需求程度为4.05,对于天气预报、日历导航等功能用户基本上不需要,因为均没有达到3.5。RSS是目前讨论和应用比较多的一种网络功能,通过RSS阅读器,用户可以订阅自己感兴趣的内容,包括图书馆网站之外的RSS资源,该功能的平均得分是3.88,属于中等需求,说明用户还是比较需要这个东西。
|
排序 |
个性化信息环境项目 |
平均需求程度 |
|
1 |
当您登录个性化信息环境后,就可使用个性化信息环境中所有的电子资源(数据库、电子期刊等),而不用在使用每一项资源时都需重新登录 |
4.20 |
|
2 |
个性化信息空间提供收藏夹功能,您可以在其中保存网上内容 |
4.05 |
|
3 |
系统提供图书馆全部的资源及服务内容供您自己选择 |
4.02 |
|
4 |
您可以搜索您收藏的内容 |
4.02 |
|
5 |
您可以对收藏的内容进行分类或主题标注 |
3.99 |
|
6 |
个性化信息环境提供储存空间供您存储个人文件和资料 |
3.93 |
7 |
提供RSS阅读器,您可以订阅自己感兴趣的内容(包括图书馆网站之外的RSS源) |
3.88 |
|
8 |
您可以采用多种方式登录个性化服务系统如您的校园卡卡号、借书证号或者电子邮件地址 |
3.86 |
|
9 |
您可以更改个性化信息环境的内容呈现方式,包括背景、颜色、字体及排列方式等 |
3.72 |
|
10 |
您可以与别人共享您收藏的内容 |
3.58 |
|
11 |
系统使用cookies,您不用每次输入账号和密码就可以自动登录 |
3.54 |
|
12 |
提供天气预报、网站导航和日历等功能 |
3.47 |
|
|
|
|
|
|
|
|
对个性化信息环境,有的人需要,有的人不太需要,通过独立样本T检验和单因子方差分析等,能够找出哪一类人对个性化信息环境有需要,哪一类人对个性化信息环境不怎么需求。首先是性别。在整个研究中的几乎每一项检验,性别都体现出很重要的差异,在我们的调查中,女性比男性更希望、更乐意使用个性化服务。个性化信息环境中列出了八项具体功能,每一项都是女性比男性需求程度高,在统计学上属于显著性差异。然后是受教育程度,不同受教育程度的人对个性化信息环境的需求也是不一样的,本科用户比硕士用户对个性化信息环境整体需求程度高,这样的结果有点出乎意外,因为根据一般人的想法,读书越多,对个性化信息环境就越有需求,但调查结果却刚好相反。另外我们还分析了网络使用能力对个性化信息环境需求的影响程度,结果显示没有显著影响,即使用能力强和使用能力弱的人在个性化环境的整体需求上没有显著差别,但是在其中的四项功能上还是一定有影响的。其他如年龄、身份、平均每个星期使用图书馆资源的次数等,对个性化信息环境整体需求及两项具体需求均有显著影响,每天平均上网时间对个性化信息环境中的一项需求有显著影响。
7.个性化服务功能需求
在个性化服务功能需求中共列举了23项功能,这些功能的平均值都在3.5以上,即这23项功能都受到读者的肯定,是读者所需要的,对个性化服务功能的整体需求程度达到3.83,这是一个比较高的值。在个性化服务功能中需求程度最高四个是:第一项是图书到期提醒,读者所借的书到期之前系统告诉读者要还书了,这项功能是读者最希望的,平均值达到4.29;第二项是网上续借,如果读者不想马上还书,通过网上服务能够办理续借手续;第三项是预约图书的到书提醒,即如果读者预约的书还回来,系统可以告诉读者预约的书到了,读者可以前来办理借阅手续了;第四项是个人当前借阅状况记录,通过这个功能,读者可以查阅个人的借书记录,包括借了那些书,哪些书什么时候到期等。从上面可以看出来,在个性化服务功能中,读者最需要的还是有关图书的借阅;另外,校外(馆外)图书馆数字资源访问的平均需求程度排在第五位;我们还调查了检索结果收藏的需求程度,即读者做了一次检索后,系统将其作为一个历史记录保存起来,这个需求不太高,只有3.67,但是现在的MyLibrary系统都能提供这个功能;还有加具个性化标签,即标签功能,需求程度也不是太高,只有3.6;对检索结果的评论,平均需求程度为3.5,读者的需求刚好达到肯定值,说明用户对这些功能有一定的需求,但也不是很强烈,而且不会太积极地参与。但是在网上书店,读者很愿意给查阅的图书加具标签或评论,这项功能如果用在图书馆中还有一段距离;个性化参考咨询和网上科技查新服务的要求也不是太高,平均需求程度分别只有3.69和3.63。
排序 |
个性化服务功能 |
平均需求程度 |
1 |
图书到期提醒 |
4.29 |
2 |
图书网上续借 |
4.27 |
3 |
预约图书到书提醒 |
4.13 |
4 |
个人当前借阅状况记录 |
4.01 |
5 |
校外(馆外)图书馆资源访问 |
3.93 |
6 |
个性化新书通报 |
3.92 |
7 |
个人借阅历史记录 |
3.87 |
8 |
向图书馆推荐您需要的书刊、电子资源等 |
3.87 |
9 |
个性化电子期刊最新目次通报 |
3.82 |
10 |
个性化图书馆活动推荐 |
3.82 |
11 |
馆际互借申请 |
3.82 |
12 |
检索结果的导出 |
3.80 |
13 |
个性化在线信息素养培训课程 |
3.80 |
14 |
个性化馆藏目录浏览 |
3.78 |
15 |
图书馆推送信息分级 |
3.74 |
16 |
个性化参考咨询 |
3.69 |
17 |
检索结果的收藏 |
3.67 |
18 |
科技查新申请 |
3.63 |
19 |
给检索结果加注个性化标签 |
3.61 |
20 |
图书馆讲座或者培训预约 |
3.60 |
21 |
留言本 |
3.59 |
22 |
个人借阅记录分析 |
3.54 |
23 |
检索结果的评论 |
3.50 |
对这二十几项个性化服务功能用因子分析进行概括,可以得出四个因子,即这二十几项功能实际上是关于四个方面的:定制服务、互动服务、图书借阅服务、检索结果处理服务。详见下表。
因子项目 |
问卷项目变量 |
因子负荷量 |
累计解释总变异量(%) |
定制服务需求 |
个性化电子期刊最新目次通报 |
.731 |
15.676 |
个性化图书馆活动推荐 |
.720 |
个性化新书通报 |
.706 |
个性化参考咨询 |
.646 |
个性化馆藏目录浏览 |
.633 |
图书馆推送信息分级 |
.550 |
互动服务需求 |
馆际互借申请 |
.702 |
30.718 |
个性化在线信息素养培训课程 |
.696 |
留言本 |
.663 |
科技查新申请 |
.662 |
校外(馆外)图书馆资源访问 |
.644 |
图书馆讲座或者培训预约 |
.603 |
图书借阅服务需求 |
图书网上续借 |
.748 |
44.797 |
个人当前借阅状况记录 |
.739 |
图书到期提醒 |
.733 |
预约图书到书提醒 |
.656 |
个人借阅历史记录 |
.632 |
检索结果处理需求 |
检索结果的收藏 |
.799 |
56.979 |
给检索结果加注个性化标签 |
.754 |
检索结果的评论 |
.722 |
检索结果的导出 |
.599 |
|
|
|
|
|
我们将个性化服务功能分为四大功能后,再看不同的读者群对这些功能的需求有没有差别。研究之后发现,性别、平均每天上网时间和网络使用能力是影响个性化服务功能整体需求程度的三项重要因素。男性对个性化服务功能的需求低于女性,平均每天上网1小时的用户对个性化服务功能的需求较低,使用网络非常不熟练的用户对个性化服务功能的需求较低,这是比较容易理解的。在四项功能中,不同性别的用户对定制服务、互动服务、图书借阅服务、检索结果处理服务的需求存在着明显差异,都是女性读者比男性读者更希望利用。本科教育程度的用户比高中及以下或硕士用户对图书借阅服务的需求程度高,平均每个星期使用图书馆资源和服务10次及以上的受试者比不使用图书馆资源和服务的受试者的需求程度高。
影响因素 |
定制服务需求 |
互动服务需求 |
图书借阅服务需求 |
检索结果处理需求 |
性别 |
女>男 |
女>男 |
女>男 |
女>男 |
年龄 |
- |
- |
- |
- |
身份 |
- |
* |
* |
- |
教育程度 |
- |
- |
本科>高中及以下
本科>硕士 |
- |
平均每个星期使用图书馆资源和服务的次数 |
10次及以上>0次 |
- |
- |
- |
使用最多的图书馆 |
- |
- |
- |
- |
使用图书馆服务的数量 |
3种>1种 |
3种>1种
4种>1种 |
* |
* |
使用图书馆资源的数量 |
- |
5种及以上>1种
5种及以上>2种
5种及以上>3种
5种及以上>4种 |
5种及以上>1种 |
5种及以上>1种 |
平均每天上网时间 |
- |
- |
3-4小时>1小时以下
5-6小时>1小时以下
7小时以上>1小时 |
- |
网络使用资历 |
- |
- |
- |
- |
网络使用能力 |
- |
- |
不熟练>非常不熟练
一般>非常不熟练
熟练>非常不熟练
非常熟练>非常不熟练 |
- |
是否使用过个性化服务 |
- |
- |
- |
- |
是否是使用过web2.0服务 |
- |
- |
- |
- |
-表示没有显著差异者,*表示有显著差异存在,经Tukey HSD事后分析并无显著差异存在者 |
8. 个性化推荐和检索功能
个性化服务的方式包括推荐和检索,我们列举了28项功能,对这28项功能的总需求程度是3.8,属于中等程度的需求,对于具体功能的平均需求程度都在3.5以上。比较高的两项是:“当系统认为您输入的语词有误时,自动给出纠正提示”,这个很受用户欢迎,达到3.96;“当你检索时系统推荐与您检索语词相似的一系列词供您参考”,对这项功能的需求也是很高,达到3.91。其他如下:①“根据你的兴趣需求提供有关学科领域用户评价较高的资源列表”,系统推荐的时候,推荐给读者的应该是有关学科领域用户评价比较好的资源,这实际上要求系统具有过滤功能,平均需求程度为3.87;②“根据您的兴趣与需求,提供有关学科和领域一定时期内各种资源被利用情况的排行榜”,对这项功能的需求程度为3.85;③“根据您的兴趣、需求和检索行为等,提供有关学科和领域重要作者发表的文献列表”,本项需求程度为3.85,与前项相同,由此可以得出,用户评价高的资源和利用情况好的资源或某个领域里重要作者发表的文献,都是读者希望系统推荐的。由此得知,读者在接受个性化推荐的时候,不是希望系统提供一般化的推荐,而且是要求系统先做选择,然后再进行推荐。
排序 |
个性化推荐和检索功能需求 |
平均需求程度 |
1 |
当系统认为您输入的语词有误时,自动给出纠正提示 |
3.96 |
2 |
图书馆提供的一站式检索中提供尽可能多的可检资源供您勾选 |
3.95 |
3 |
当您检索时,系统推荐与您检索语词相似的一系列词供您参考 |
3.91 |
4 |
图书馆提供多种资源的一站式检索 |
3.88 |
5 |
根据您的兴趣与需求,提供有关学科或领域用户评价较高的资源列表 |
3.87 |
6 |
根据您的兴趣与需求,提供有关学科或领域一定时期内各种资源被利用情况排行榜 |
3.85 |
7 |
根据您的兴趣、需求和检索行为等,提供有关学科或领域重要作者发表的文献列表 |
3.85 |
8 |
系统根据您的背景、兴趣、需求和检索行为等,为您设置一站式检索的被检资源 |
3.85 |
9 |
根据您的兴趣与需求,提供有关学科或领域最多用户推荐的资源 |
3.84 |
10 |
根据您的背景、兴趣、需求和检索行为等,系统自动提供相应内容深度的检索结果给您 |
3.82 |
11 |
根据您的背景、兴趣、需求和检索行为等,系统自动提供相应水平层次的检索结果给您 |
3.81 |
12 |
根据您的兴趣与需求,提供有关学科或领域资源被引用次数的排行榜 |
3.80 |
13 |
根据您的兴趣、需求和检索行为等,提供有关学科或领域重要机构发表的文献列表 |
3.80 |
14 |
根据您的背景、兴趣、需求和检索行为等,系统自动提供相应内容广度的检索结果给您 |
3.80 |
15 |
根据您的兴趣与需求,提供有关学科或领域最常用的检索词、检索表达式的排行榜 |
3.79 |
16 |
当您需要的是文献中的图表或数据时,系统可以直接提供相应的图表或者数据,而不是文献的全文 |
3.79 |
17 |
自然语言检索 |
3.78 |
18 |
根据您的兴趣与需求,进行候选资源的推荐 |
3.75 |
19 |
根据您的兴趣与需求,提供有关学科或领域历年来被借图书的排行榜 |
3.75 |
20 |
根据您的兴趣与需求,提供有关学科或领域资源被下载次数的排行榜 |
3.75 |
21 |
自然语句检索 |
3.73 |
22 |
系统按照您的兴趣或者需求进行检索结果的排列 |
3.72 |
23 |
根据您的兴趣与需求,提供有关学科或领域用户最常使用的标签 |
3.69 |
24 |
系统对您的检索过程进行追踪,您可以选择系统追踪和提供数据的内容 |
3.69 |
25 |
系统提供相近用户或者同一社群用户最常用的检索词、检索表达式、数据库、期刊等信息供您参考 |
3.68 |
26 |
系统提供检索表达式的定制功能,当下一次再使用该检索表达式时,只显示上次检索以来的新增结果 |
3.68 |
27 |
系统根据您的个人背景、兴趣和需求中的信息,自动进行检索条件的限定 |
3.62 |
28 |
系统提供您的检索趋势分析 |
3.59 |
在个性化推荐和检索中我们特别调查了一站式检索,因为个性化服务实际上暗含着一站式服务。为了提供一站式资源检索服务,系统首先要对资源进行整合,并要为读者提供选择机会。在一站式检索中,要提供尽可能多的可检资源供读者勾选,比如图书馆购买了一百个数据库,就应把一百个数据库的列表全部放在检索界面中,读者检索的时候需要几个就勾选几个,这一功能的需求程度最高,达到3.95。有的图书馆系统提供默认资源检索服务,例如在跨库检索中,读者一进入跨库系统,系统默认全部资源检索一遍,这项功能不能满足用户的需求,用户还是希望系统提供的资源是全的,但是可以自己选择。另外,系统根据读者的背景、兴趣、需求和检索行为,为用户设置一站式检索的被检资源,对这一功能的需求程度是3.8。该项功能完全是自动的,例如如果是张三检索,系统根据张三的特点为他提供五十个数据库,如果是李四检索,系统根据李四的特点为他提供三十个数据库。总的来说,用户对一站式检索的需求还是比较强烈的。在一站式检索需求中,读者最希望检索的前五位分别是普通图书、电子图书、全文电子期刊、学位论文、馆外免费资源,其中,500多人中有400多人选择普通图书。我们还调查了用户返回检索结果的需求,其中最多的还是希望一站式检索返回的是每一资源的全部结果,比如检索三十个数据库,三十个数据库中跟检索要求有关的所有结果都提供出来,对这项功能的要求是30.6%,排在第二位的是系统每次返回25条结果,例如某个数据库有一百条记录,系统只需要返回25条,另一个数据库有八十条记录,系统也只需要返回25条,返回五十条检索结果的功能需求排在第三位,而更多的如一百条以上选择得人比较少。总体来讲,要求返回结果数量最多和最少的排得最低,所以这是一个中间值。这个调查告诉我们,在设计一站式检索系统的时候,要给读者一个选择的余地,返回的每一个数据库的结果是多少,应该让读者有所决定权。在响应时间方面,45.5%的用户对一站式检索系统在一分钟以内把结果提供给用户还是可以容忍的,33.6%的用户希望等待1-2分钟。
对个性化推荐和检索的28项功能进行因子分析后得出四个大的方面:个性化推荐、检索限定和处理、一站式检索、自然检索。这四个方面按照人口学特征来看,影响个性化推荐和检索整体需求的因素首先是性别,其次是平均每个星期使用图书馆资源和服务的次数、使用图书馆服务的数量、使用图书馆资源的数量,网络使用能力不同的人对个性化推荐和检索功能的需求也是不一样的。
影响因素 |
个性化推荐功能需求 |
检索结果限定和处理功能需求 |
一站式检索功能需求 |
自然检索功能需求 |
性别 |
女>男 |
- |
女>男 |
女>男 |
年龄 |
- |
- |
- |
- |
身份 |
- |
- |
- |
- |
教育程度 |
本科>大专
博士>大专 |
- |
本科>硕士
本科>博士 |
- |
平均每个星期使用图书馆资源和服务的次数 |
10次以上>0次
10次以上>1-3次 |
- |
- |
- |
使用最多的图书馆 |
- |
- |
- |
- |
使用图书馆服务的数量 |
- |
- |
三种>一种
四种>一种 |
- |
使用图书馆资源的数量 |
四种>一种
五种及以上>一种 |
五种及以上>一种
五种及以上>两种 |
三种>一种
四种>一种
五种及以上>一种 |
五种及以上>一种 |
影响因素 |
个性化推荐功能需求 |
检索结果限定和处理功能需求 |
一站式检索功能需求 |
自然检索功能需求 |
平均每天上网时间 |
1-2小时>1小时以下
3-4小时>1小时以下
5-6小时>1小时以下 |
- |
1-2小时>1小时以下
3-4小时>1小时以下
5-6小时>1小时以下
7小时以上>1小时以下 |
1-2小时>1小时以下 |
网络使用资历 |
- |
- |
- |
- |
网络使用能力 |
不熟练>非常不熟练
一般>非常不熟练
熟练>非常不熟练
非常熟练>非常不熟练 |
不熟练>非常不熟练
熟练>非常不熟练
非常熟练>非常不熟练 |
不熟练>非常不熟练
一般>非常不熟练
熟练>非常不熟练
非常熟练>非常不熟练 |
一般>非常不熟练
熟练>非常不熟练
非常熟练>非常不熟练 |
是否使用过个性化服务 |
- |
- |
- |
- |
是否是使用过web2.0服务 |
- |
- |
- |
- |
9.个性化服务工具
用户对个性化信息服务工具的整体需求程度是3.64,需求程度不算太高,从下表中可以看出,在个性化信息服务工具中,电子邮件是用户最希望接受的推送工具,手机短信推送的接受程度还不是很高,然后是图书馆书签、桌面推送工具,用手机短信推送的接受程度是3.45,最后面的两个需求均没有达到3.5的肯定门槛。对于这些个性化服务工具,用户希望能够嵌入到图书馆的用户系统和界面中。
排序 |
个性化服务工具 |
平均需求程度 |
1 |
用于推送服务的电子邮件 |
3.77 |
2 |
Library Lookup书签 |
3.73 |
3 |
桌面信息工具 |
3.73 |
4 |
用于推送服务的RSS |
3.70 |
5 |
用于参考咨询服务的QQ、MSN等实时通讯工具 |
3.69 |
6 |
用于参考咨询服务的社会性网络软件 |
3.61 |
7 |
图书馆工具条 |
3.60 |
8 |
用于推送服务的迷你博客网站Twitter及类Twitter的服务饭否等 |
3.46 |
9 |
用于推送服务的手机短信 |
3.45 |
10. 个人隐私保护政策需求
最后是关于用户的个人隐私保护政策。用户对个人隐私保护是非常需求的,调查结果显示,整体需求程度达到了4.23,七项具体的个人隐私保护政策的需求程度均在4.0以上,所以图书馆的个性化服务必须解决个人信息的保护问题,如果不能给人以信心,读者宁可不需要。在七项具体保护方面,最低的是4.01。首先是隐私权的保护政策,应该明确保证个人信息不被损坏或盗用,图书馆也好,其他信息服务机构也好,为了个性化服务的需要搜集或推理用户的信息,必须先向用户保障这个信息不被损坏或不被盗用,这个要求是很高的,如果做不到这一点,用户是不放心的。例如在图书馆,系统可以对读者信息进行分析统计,如读者对哪一类书感兴趣,一般的需求信息可能不会存在问题,但有些读者某一时期集中看某一类的书,这种阅读倾向属于读者的个人隐私,例如小青年谈恋爱,他老去找谈恋爱的书看。美国911之后,总统发布命令,要求图书馆把读者某一段时间内集中借阅的可能与恐怖活动有关的书向政府报告,但是美国图书馆协会对这个要求抵制得非常厉害,因为图书馆要保护读者权利。系统可以根据用户的借阅行为向用户推荐所需要的资料,比如某位读者喜欢看武侠小说,以后每进一本新的武侠小说就推荐给这位读者,图书馆可以把服务数据分析出来,作为个性化服务的依据,这是没有问题的,但是图书馆如果把分析结果用于别的目的,那是不会被读者接受的,国内图书馆界在这方面还没有太多争论,但在国外尤其是美国却争论得很多。第二个要求是:隐私保护政策要说明争议出现之后的解决办法,即如果隐私保护出现了争议和问题,怎么解决,应有一个明确的宣示。第三,读者有权浏览、修改、删除个人被图书馆收集的信息资料,这项功能的要求也很高。系统搜集用户的信息,用户需要知道系统到低搜集了哪些信息,系统分析用户的借阅和检索行为,用户也要知道分析出来的结果是什么,如果用户不乐意系统继续拥有,应有权修改或删除,这项功能的要求也是比较很高的。从上述分析可以看出来,用户对隐私保护是很重视的,然而国内图书馆界对此却重视不够。以前不明显,现在个性化服务推广以后,这个问题就出来了。用户个人的信息如偏好、兴趣和行为规律等,图书馆如果用来给用户提供服务是没有问题的,但是如果图书馆泄露或用于别的目的,哪怕是像美国政府为了反恐的需求而掌握这些资料,也会导致用户的强烈反对。如果图书馆做不到这一点,一个是读者权利得不到保障,另外一个,用户是不会放心使用图书馆的个性化服务的。同样,虽然对个人隐私保护政策需求的要求很高,但不同用户群体对个人隐私保护政策的需求也不一样,影响因素包括性别、受教育程度、使用图书馆资源的数量、平均每天上网时间、网络使用能力等。
排序 |
个人隐私保护政策需求 |
平均需求程度 |
1 |
隐私权保护政策应该明确保证个人信息不被损坏或者被盗用 |
4.39 |
2 |
隐私权保护政策明确说明争议出现之后的解决办法 |
4.34 |
3 |
您有权浏览、修改和删除您被收集的个人信息资料 |
4.25 |
4 |
您有权利决定您个人信息的使用范围 |
4.23 |
5 |
您有权知道您个人信息的收集、处理、存储与利用的状况 |
4.23 |
6 |
隐私权保护政策包括限制利用信息的承诺,保证对于所收集的个人信息,只用于收集时所申明的目的 |
4.15 |
7 |
收集个人信息时,及时给予您明确的提示,告知您收集个人信息的目的、方式和范围,并提供选择方案,让您选择同意还是不同意 |
4.01 |
六.结论
根据前面的调查结果我们可以得出一些大的结论。首先,目前个性化服务的使用并不普遍。在图书馆领域之外的个性化服务读者用得比较多,但图书馆内部的个性化服务读者用得却比较少。一方面我们要找原因,另一方面要在宣传推广上做工作。例如有些数据库有个性化服务功能,但大部分读者不知道这个功能,即使知道有也不知道如何使用。第二个结论就是,用户对个性化服务的需要还是有的,无论是个性化信息环境、个性化服务功能、个性化推荐与检索以及个性化服务工具等,调查结果都是倾向于需要,而且总体需要程度还是比较高的,但尽管用户对个性化服务的Web2.0工具也有一定的需求,但需求不是特别高。另外一个结论是,性别、受教育程度、图书馆资源使用程度、每天上网时间、网络使用能力等因素对不同读者群在个性化服务需求方面存在影响,即图书馆提供个性化服务,不是所有的读者都需要或不需要,需要高或需要低,总得来讲,女性对个性化需求比男性高,本科生对个性化需求比硕士与博士高,也比本科以下的用户高,使用网络非常不熟练的用户对个性化服务的需求比较低。
我今天的讲座就到这里,谢谢大家。