技术解读 23小时前 109 阅读 0 评论

拆解《闲鱼智能监控机器人》项目

作者头像
人人都是产品经理

AI技术专栏作家 | 发布了 246 篇文章

在大模型、Agent与自动化运营迅猛演进的当下,闲鱼悄然孵化的一项“智能监控机器人”项目,藏着平台类产品在“海量长尾内容治理”上的一次重要探索。

一、项目概述

核心解决的问题

该项目核心旨在解决用户在咸鱼二手交易平台手动淘货时面临的以下痛点:

  • 信息过载与筛选低效:闲鱼商品信息庞杂,用户需要花费大量时间手动浏览、对比和筛选。
  • 交易风险识别困难:卖家身份复杂,难以有效区分个人玩家和商家,增加了“踩坑”和被骗的风险。
  • 优质货源获取滞后:热门商品更新快,手动刷新常常错过优质好价。
  • 配置和操作复杂:传统监控工具通常需要用户直接修改配置文件或使用命令行,门槛高。

项目的亮点

  • AI驱动的智能分析:结合多模态大模型,对商品图文和卖家画像进行深度分析,实现了从“信息过滤”到“智能推荐”的飞跃。
  • 可视化Web管理界面:提供直观、友好的WebUI,让任务管理、日志查看、结果浏览等操作变得简单。
  • 高度可定制与自动化:支持通过自然语言创建任务,并可配置独立的关键词、价格、筛选条件和AI评估标准。
  • 实时高效与健壮稳定:采用异步并发架构和API拦截技术,实现实时监控和高效数据抓取,并通过模拟真人操作提高反爬能力。
  • 分层提示词工程:将提示词分为基础模板和商品特定标准,实现了提示词的模块化、版本化管理,易于扩展和优化。

二、项目架构

系统架构

项目的系统架构可以概括为以下模块,通过Fast API提供的API接口进行协同工作。

整体概述

  • 前端(WebUI):用户操作界面,负责任务管理、配置、结果展示等。
  • 后端(FastAPI):作为核心服务,处理来自前端的请求,并调度任务执行。
  • 爬虫引擎(Playwright):负责与闲鱼网站交互,抓取数据。
  • 任务调度器(APScheduler):管理定时和即时任务的执行。
  • AI分析服务(OpenAIAPI):接收爬虫数据,进行智能评估。
  • 数据存储(JSON):以JSON文件形式存储任务配置、运行状态和分析结果。
  • 通知系统(ntfy等):负责将AI推荐结果推送给用户。

系统架构图:

业务流程图

项目应用操作流程

1)登陆配置:用户获取咸鱼登录Cookie,通过Web界面或配置文件进行配置。

2)任务创建:

  • 手动创建:用户天蝎关键词、价格范围、筛选条件等。
  • AI驱动创建:用户用自然语言描述需求,系统自动生成任务。

3)任务运行:用户在Web界面启动任务,调度器根据定时规则或立即执行。

4)数据抓取:爬虫根据任务配置,模拟浏览器行为,抓取咸鱼商品数据。

5)AI分析:抓取到的商品数据被送至AI模型进行深度评估。

6)结果处理:AI返回结构化分析结果,后端服务将符合推荐条件的商品保存并发送通知。

7)结果查看:用户在Web界面浏览和筛选推荐结果,查看详细分析日志。

业务流程时序图:

三、项目核心功能

功能一:AI驱动的智能商品评估

功能概述

该功能是项目的核心,它将传统的爬虫数据过滤提升为由 AI 模型主导的深度分析。它不仅仅是基于关键词和价格的筛选,而是通过一个高度定制化的提示词,让 AI 像一个经验丰富的二手交易专家一样,综合评估商品的图文信息、卖家的历史行为,最终给出是否推荐、推荐原因、风险标签等结构化的判断。

功能亮点

  • 多模态融合:同时处理商品图片和文字,避免单一文本分析的局限性。
  • 卖家画像分析:引入了“画像优先原则”,AI会通过多维度行为分析来判断卖家是“个人玩家”还是“专业贩子”,从而做出更精准的推荐。
  • 结构化输出:强制AI以特定的JSON格式返回结果,确保了数据的可解析性和后续处理的自动化。
  • 可解释性:AI的分析结果包含reason(理由)、risk_tags(风险标签)和criteria_analysis,让用户清楚了解推荐或否决的原因。

功能实现

时序图呈现实现逻辑:

流程图呈现应用流程:

功能二:卖家画像分析

功能概述

深度分析卖家的交易历史、商品类型、评价记录等信息,构建完整的卖家信用档案。

功能亮点

  • 行为模式识别:区分个人玩家vs商家。
  • 时间序列分析:分析交易频率和时间分布。
  • 逻辑一致性检验:验证买卖行为的合理性。
  • 风险信号检测:识别批量操作、模版化描述等商家特征。
  • 功能实现

功能呈现时序图:

功能三:AI智能分析

功能概述

基于多模态AI技术,结合商品文本描述和图片信息,提供专业级的商品评估和推荐。

功能亮点

  • 多模态分析:同时处理文本和图片信息。
  • 结构化输出:标准化的JSON格式结果。
  • 证据驱动:每个判断都提供具体证据。
  • 风险评估:多维度风险标签和等级。

数据管理

数据流转时序图:

数据层级模块图:

模型应用

应用场景:

  • 二手电子产品质量评估。
  • 卖家可信度分析。
  • 价格合理性判断。
  • 交易风险预警。

模型价值:

  • 专业性:提供专家级的商品评估能力。
  • 一致性:标准化的评估标准,避免主观偏差。
  • 效率性:完成复杂的多维度分析。
  • 可解释性:提供详细的分析依据和证据。

提示词拆解:

角色定义层

你是世界顶级的二手交易分析专家,代号EagleEye-V6.4。

作用:建立AI的专业身份认知。

-优化建议:在角色定义上,可以考虑更精炼的表述,如将“代号”等概念进行精简,使提示词的指令部分更加简洁明了。

核心原则层

-画像优先原则 (PERSONA-FIRST PRINCIPLE)

-一票否决硬性原则 (HARD DEAL-BREAKER RULES)

-图片至上原则 (IMAGE-FIRST PRINCIPLE)

作用:建立分析的基本逻辑框架。

优化考量:在多个原则并存时,建议进一步明确其优先级,以应对可能出现的评估权衡场景。

分析维度层

“`

{

“model_chip”: “型号芯片验证”,

“battery_health”: “电池健康度”,

“condition”: “成色外观”,

“history”: “维修历史”,

“seller_type”: “卖家类型分析”,

“shipping”: “邮寄方式”,

“seller_credit”: “卖家信用”

}

“`

作用:确保分析的全面性和结构化。

优化:可根据商品类型动态调整分析纬度。

输出格式层

“`

{

“prompt_version”: “EagleEye-V6.4”,

“is_recommended”: boolean,

“reason”: “综合评价”,

“risk_tags”: [“风险标签”],

“criteria_analysis”: {…}

}

“`

作用:确保输出的标准化和可解析性。

优化考量:当前输出JSON结构虽然详尽,但嵌套层级较深,建议在保证信息完整性的前提下,探索简化的可能,以提高后续数据处理的效率。

商品特定规则层

“`

# MacBook特定规则

– 必须是 MacBook Air M1 芯片

– 电池健康度 ≥ 90%

– 卖家信用等级必须是’卖家信用极好’

# DJI特定规则

– 必须是 Mini 3 Pro 畅飞套装

– 电池循环次数 ≤ 50 次

– 无炸机维修历史

“`

作用:针对不同商品类型的专业化评估。

优化:模块化设计,便于维护和扩展。

提示词优化建议:

5.1 简化结构 : 减少嵌套层级,提高可读性。

5.2 模块化设计 : 将通用逻辑和商品特定规则分离。

5.3 动态组合 : 根据商品类型和分析需求动态构建提示词。

5.4 版本管理 : 建立提示词版本控制机制。

5.5 性能优化 : 减少token消耗,提高响应速度。

建议改进的提示词架构:

“`

# 核心分析器

你是专业的二手商品分析师,负责评估商品质量和卖家可信度。

# 分析框架

1. 商品本身评估(型号、成色、价格)

2. 卖家可信度分析(交易历史、行为模式)

3. 交易安全性评估(邮寄、售后保障)

# 输出格式

{

“recommendation”: “STRONG_BUY|BUY|HOLD|AVOID”,

“confidence”: 0.85,

“key_factors”: [“主要影响因素”],

“risk_level”: “LOW|MEDIUM|HIGH”,

“summary”: “简洁的分析总结”

}

# 商品特定规则

{{PRODUCT_SPECIFIC_RULES}}

“`

总结

该项目设计思路新颖,切入点精准,将 AI 技术与爬虫技术深度融合,具有很高的实用价值。提示词设计专业性极高,为 AI 能力的落地提供了优秀的实践范例。在实际测试中,即使在纯文本模型下也能正常运行,虽然某些依赖多模态能力的数据会缺失,但这为项目未来的扩展提供了清晰的升级方向 。

本文由 @界面与交互 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!