文字类
聊天对话写作助手论文查重语言翻译内容检测
办公类
文档处理会议记录思维导图智能表格智能演示
社区类
换脸类
图像类
创意画图&插画制作头像&写真移除背景&物体无损优化&修复
视频类
虚拟数人视频生成视频编辑视频字幕
音频类
变声工具语音生成语音转字音乐创作音频编辑
设计类
编程类
编码助手模型训练开发框架模型评测
学习类
GitHub工具集Prompt提示指令资源平台Up主频道AI工具教程

00

GitHub工具集

WebCPM

首个支持联网的中文 AI 问答模型

WebCPM 是一个基于交互式网页搜索的中文长文本问答（Long-form Question Answering, LFQA）开源模型框架。它由清华大学自然语言处理实验室的研究人员开发，并在自然语言处理顶级会议 ACL 2023 上发表。

WebCPM 的主要特点和功能包括：

交互式网页搜索：WebCPM 能够模拟人类与搜索引擎的交互行为，通过多轮搜索和信息浏览来收集回答问题所需的事实性知识。
信息检索与合成：它采用检索-综合范式，包括信息检索和信息综合两个核心环节，以生成详细且连贯的答案。
开源数据集：WebCPM 提供了一个基于交互式网页搜索的公开问答数据集（IWSQA），包含5500个高质量的问题-答案对，以及大量的支持事实和网页搜索动作。
模块化框架：WebCPM 的框架包括搜索模型和答案综合模型。搜索模型进一步分为动作预测、查询语句生成和支持事实摘要三个子任务。
模型训练：使用多达100亿参数的预训练模型进行微调，以模仿人类的网页搜索行为，并根据收集到的事实生成答案。
开源实现：WebCPM 提供了开源的网页搜索界面、数据集、实现方法和模型参数，以促进该领域的研究和应用。
实验评估：在实验中，WebCPM 在32.5%的情况下生成的答案不逊于人类，并且在DuReader数据集上，有47.5%的情况下生成的答案优于人工标注的答案。

WebCPM 的研究工作为中文长文本问答领域提供了新的数据集和方法论，展示了大模型在处理复杂问答任务时的潜力。通过开源其资源，WebCPM 鼓励更多的研究者和开发者参与到这一领域的探索和发展中。

评论(0)

0/200

暂无评论