将密集的检索解释为主题的混合物
密集检索(DR)在第一阶段的检索中达到了最先进的结果,但我们对促成其成功的机制知之甚少。因此,在这项工作中,我们对最近提出的DR模型进行了解释研究。具体来说,我们首先将文档和查询编码器的嵌入输出离散化。基于离散表示,我们分析了输入标记的归属。对公共试验收集品进行了定性和定量实验。结果表明,DR模型注意输入的不同方面,并提取各种高级主题表示。因此,我们可以将DR模型学习到的表示看作是高级主题的混合物。
原文题目:Interpreting Dense Retrieval as Mixture of Topics
原文:Dense Retrieval (DR) reaches state-of-the-art results in first-stage retrieval, but little is known about the mechanisms that contribute to its success. Therefore, in this work, we conduct an interpretation study of recently proposed DR models. Specifically, we first discretize the embeddings output by the document and query encoders. Based on the discrete representations, we analyze the attribution of input tokens. Both qualitative and quantitative experiments are carried out on public test collections. Results suggest that DR models pay attention to different aspects of input and extract various high-level topic representations. Therefore, we can regard the representations learned by DR models as a mixture of high-level topics.
相关文章
- Windows原生不好用,我给你找了这些第三方软件
- 外媒总结 Windows 11 家庭版、专业版区别:专业版可支持 2TB 内存
- Windows 11家庭版、专业版区别曝光:功能差异不小
- Windows 10专业版,怎么隐藏任务栏u盘图标?Windows 10隐藏U盘图标方法
- Windows 10更新,提示缺少重要的安全和质量修复怎么办?
- 想要升级Windows11系统?请注意这些问题
- 苹果 macOS Big Sur 11.5.1(20G80)正式版发布,修补重大漏洞
- 5个为 Linux 高级用户准备的也是最常用的开源 shell
- Chrome正获得原生截图功能 右键菜单整合Google Lens搜图功能
- 微软再发提醒:Microsoft 365套件即将停止对IE11的支持
- 微软新提案让Chrome页面加载速度更快
- Linux 包管理器比较:dnf 和 apt
- OpenHarmony编译构建系统详解,从零搭建Windows下开发环境,巨方便!
- 谷歌 Chrome 浏览器将内置截图工具,以及“以图搜图”功能
- 微软帮助下,谷歌 Chrome 等浏览器打开新标签页速度将提升
- 注意,这些Windows 10版本将停止更新!微软提醒用户尽快升级
- Windows 11发布了,那么电脑安装Windows 11稳定吗?
- 在 Linux 上批量处理图像的 Converseen
- 禁用Windows 10系统自动更新,我有妙招
- 微软详细介绍了Windows 11商店中的Win32桌面应用程序分发方式