AI_Interaction_Concept_01

LAB · AI 实验

用户在填写表单时，很少会按照结构化的字段顺序逐一输入。更常见的是：用户在一个文本框里倾倒所有信息——“我上周二从深圳飞北京，航班号CA1234，需要电子发票，税号91110108MA01XXXXXX”。

传统表单要求用户将这段信息拆解为：出发日期、出发城市、目的城市、航班号、发票类型、税号——六个独立字段。每一个字段都是一次认知摩擦。

我们使用 GPT-4 和 Claude 3.5 Sonnet 两个模型，对 200 组真实用户的非结构化输入进行解析测试。每组输入包含 3-8 个隐含字段，涉及日期、地点、数字编号、布尔选项等类型。测试从提取准确率、置信度校准、降级体验三个维度进行评估。

Claude 3.5 Sonnet 在复杂嵌套信息提取上表现优于 GPT-4，特别是在涉及中文地址和税号格式的场景。但当用户输入包含口语化表达（如”就那个什么来着”）时，两个模型的准确率都显著下降。

更有趣的是，当我们将解析结果以 inline suggestion（字段旁浮现灰色建议文字）而非自动填充的方式呈现时，用户的接受度提升了 62%。用户更倾向于”被建议”而非”被替换”。

正在设计一个混合交互模式：高置信度字段自动填充 + 低置信度字段以 ghost text 形式提示。计划在下个 Sprint 进行可用性测试。