融合多源异构数据的推荐与检索_冀振燕 ... [等] 著_9787568933674

为了解决信息过载问题, 最常用的两种技术是推荐引擎和搜索引擎。搜索引擎倾向于明确的搜索目标, 可以将信息的查询转换为精确的关键字搜索, 搜索后返回给用户搜索列表, 用户可以对这些返回结果进行反馈, 用户具有主动意识。推荐引擎倾向于没有明确目标, 或者目标模糊, 推荐系统通过用户的历史行为或者用户的兴趣偏好或者用户的人口统计学特征进行推荐, 生成用户可能感兴趣的项目列表, 用户比较被动。本书基于作者团队多年的研究成果, 介绍了推荐和检索领域的最新发展、常用的技术和算法、以及作者团队所提出的融合多源异构数据的推荐模型、跨模态的检索模型, 相关工作已在国内外权威期刊上发表, 本书的内容反映了本领域的最新发展。

本章介绍了解决信息过载问题常用的**与检索技术，描述了融合多源异构数据的**与检索所具有的优势和面临的挑战。

1.1**与检索

近年来，随着云计算、人工智能、计算机**、多媒体、物联网等信息技术在全球的飞**展，互联网时代已正式到来。互联网时代的到来，既为传统行业带来了挑战，又催生了新兴产业，为新兴经济的发展带来了机遇。互联网已经与人们的生活息息相关，人们通过网络可以进行新闻阅读、网上购物、移动支付、在线教育等活动。一方面，人们享受着互联网带来的便利，能够便捷地从网络中获取丰富的信息；另一方面，大数据也带来了信息过载的问题。如何高效快速地为用户提供其真正需要的信息，如何从大量数据中挖掘出真正有价值的内容，是互联网发展过程中面临的重要挑战。

解决信息过载问题*常用的两种技术是：主动为用户**其感兴趣的内容的**引擎；用户搜索信息时为其提供更精准的搜索结果的搜索引擎。**引擎倾向于没有明确目标或目标模糊，通过用户的历史行为、用户的兴趣偏好或用户的人口统计学特征进行**，生成用户可能感兴趣的项目列表，用户比较被动。搜索引擎倾向于明确的搜索目标，可以将对信息的查询转换为**的关键字，搜索后返回给用户搜索列表，用户可以对这些返回结果进行反馈，用户具有主动*。

1.1.1**

迄今为止，**系统已经发展了20多年。在应用领域方面，**系统不仅被应用在**商务平台（***、****）为用户**物品，还被应用在了信息检索(Coogle、百度、Yahoo)、社交媒体（Twitter、微博）、音乐电台（网易云音乐、Apple Music）、视频**等各种领域。在数据种类方面，随着移动设备和可穿戴设备的发展，网络中能够收集到的信息种类逐渐增多，除了数字信息外还可以收集到文本、图像、社交关系、声音、视频等各种异构数据。在评价指标方面，除了准确度和召回率，归一化折损累计增益、覆盖率等也常用来评估**结果的好坏。

尽管**算法随着应用场景的变换而不同，但提高准确率是所有**算法追求的目标。基于内容的**、协同过滤**、混合**是传统**算法中*主要的三类。其中，基于内容的**算法的关键是获取用户的兴趣偏好，在获得用户偏好后，此类算法为用户**与其偏好类似的物品。在协同过滤中，认为两个相似的用户对同一物品的打分是相近的，同一个用户对两个类似物品的打分也是相近的。混合**算法则是将不同**算法按照一定的策略融合，可以分为算法层面的融合和数据源层面的融合。传统的**算法大多存在**精度不高、特征提取困难等问题，为了解决这些问题，专家学者在**系统中引入了深度学习技术。尽管深度学习的引入能够提高**结果的准确*，但它也带来了计算复杂度增大、**结果可解释*差的问题。大多数**算法仅使用评分数据来为用户提供**，并没有充分利用互联网中收集到的各种如评论数据、社交网络信息等异构数据。

你还可能感兴趣

我要评论