LAB · AI 实验
AI_Interaction_Concept_01
用户在填写表单时,很少会按照结构化的字段顺序逐一输入。更常见的是:用户在一个文本框里倾倒所有信息——“我上周二从深圳飞北京,航班号CA1234,需要电子发票,税号91110108MA01XXXXXX”。
传统表单要求用户将这段信息拆解为:出发日期、出发城市、目的城市、航班号、发票类型、税号——六个独立字段。每一个字段都是一次认知摩擦。
我们使用 GPT-4 和 Claude 3.5 Sonnet 两个模型,对 200 组真实用户的非结构化输入进行解析测试。每组输入包含 3-8 个隐含字段,涉及日期、地点、数字编号、布尔选项等类型。测试从提取准确率、置信度校准、降级体验三个维度进行评估。
Claude 3.5 Sonnet 在复杂嵌套信息提取上表现优于 GPT-4,特别是在涉及中文地址和税号格式的场景。但当用户输入包含口语化表达(如”就那个什么来着”)时,两个模型的准确率都显著下降。
更有趣的是,当我们将解析结果以 inline suggestion(字段旁浮现灰色建议文字)而非自动填充的方式呈现时,用户的接受度提升了 62%。用户更倾向于”被建议”而非”被替换”。
正在设计一个混合交互模式:高置信度字段自动填充 + 低置信度字段以 ghost text 形式提示。计划在下个 Sprint 进行可用性测试。