影刀RPA实操指南_TEMU跨境电商数据采集从零到自动化的完整方案
影刀RPA实操指南TEMU跨境电商数据采集从零到自动化的完整方案TEMU是近年跨境电商里增速最快的平台之一。对于做TEMU的运营来说商品数据监控、竞品价格跟踪、店铺表现分析这些每天都要做。手动点几十个页面查数据的效率太低了。真正需要自动化的往往不是能不能做的问题而是一天要做几百次的重复劳动。这篇文章用影刀RPA TEMU平台实战讲清楚跨境电商自动化采集的正确姿势。一、TEMU数据采集的难点和国内电商不一样TEMU有几个特殊的问题难点说明网络环境需要外网访问代理必不可少页面国际化中英文混排元素定位需要多语言兼容反爬机制比国内平台严格频率控制很重要登录态维护Cookie过期比国内平台快价格多币种美元标价清洗时需要转换解决这些难点关键在于稳而不是快。二、环境准备代理 浏览器配置TEMU 采集第一步是确保能访问# 代理配置——在影刀浏览器启动前完成# 方式一影刀客户端设置全局代理# 路径影刀设置 → 浏览器 → 代理设置 → 填入代理地址# 方式二用系统代理# Windows设置 → 网络和Internet → 代理 → 手动设置代理选择建议拼多多店群自动化上架方案固定住宅代理稳定性最优适合长期采集数据中心代理速度快但容易被识别适合短期大批量采集不推荐免费代理速度慢、不稳定、随时失效一个实际坑代理配置后要测试。先手动打开 TEMU 首页确认能加载再跑自动化流程。不然跑一半才发现没网时间全白费。三、TEMU商品搜索的自动化# TEMU商品搜索采集——标准写法打开网页(https://www.temu.com,浏览器影刀浏览器)等待元素出现(搜索输入框,10秒)# TEMU加载可能比国内平台慢# 输入关键词直接搜索框不支持清空换URL拼接方式关键词wireless earbuds关键词_编码URL编码(关键词)新URLhttps://www.temu.com/search_result.html?search_key关键词_编码 打开网页(新URL)等待元素出现(商品列表,10秒)# 采集商品信息获取相似元素列表(商品卡片)-商品列表TEMU 搜索特色URL 里的search_key参数可以直接拼接关键词比操作搜索框更稳。因为 TEMU 的搜索建议弹窗非常积极键盘回车可能被吞掉。四、采集商品核心数据TEMU 商品卡片的信息结构# TEMU商品详情采集新建Excel-采集结果表 写入行数据(采集结果表,[商品名称,美元价格,人民币价格,销量,评分,商品链接,采集时间])遍历列表(商品列表,当前商品):# 商品名称——多语言名称获取元素文本(当前商品//.product-title)# 美元价格美元价获取元素文本(当前商品//.price-amount)# 价格清洗去掉美元符号美元价替换文本(美元价,$,)美元价替换文本(美元价,,,)# $1,299 去掉逗号# 转换成人民币取当天汇率汇率7.25# 建议用API实时获取人民币价ToNumber(美元价)*汇率# 销量TEMU很多商品不直接显示销量用评论数估算评论数获取元素文本(当前商品//.review-count)# 评分评分获取元素文本(当前商品//.rating-score)写入行数据(采集结果表,[名称,美元价,人民币价,评论数,评分,])价格清洗的细节TEMU 价格会有各种格式$12.99 $1,299.00 From $5.99 $9.99 - $19.99最终清洗脚本# Python代码指令——统一价格清洗价格原始{美元价}# 从影刀变量传入importre# 提取所有数字格式的价格pricesre.findall(r\$?\s*([\d,]\.?\d*),价格原始)ifprices:# 取第一个匹配的价格cleanprices[0].replace(,,)resultfloat(clean)else:result0.0五、TEMU商品详情页采集列表只拿到基本信息更多数据需要进详情页# TEMU详情页采集——价格规格描述点击元素(当前商品)# 进入详情页等待(2秒)# TEMU详情页加载稍慢# 采集详情信息价格获取元素文本(详情页价格)原标题获取元素文本(详情页标题)# 规格信息——TEMU规格用的是选择器# 获取所有选中规格的文本规格文本获取元素文本(规格区域)# 商品描述描述获取元素文本(商品描述区域)# 采集完关闭详情页或返回发送按键({ESC})# TEMU详情一般是弹窗ESC关闭等待(1秒)六、多页翻页与并发控制# TEMU翻页——URL参数控制当前页码1最大页数50# 不要一次采太多条件循环(当前页码最大页数):翻页URLhttps://www.temu.com/search_result.html?search_key关键词_编码pageToString(当前页码)打开网页(翻页URL)等待元素出现(商品列表,8秒)采集当前页商品()# 调上面写好的采集子流程当前页码当前页码1# 频率控制TEMU每页至少等5秒等待(5秒)频率控制的经验值TEMU 对请求频率比国内平台敏感得多操作建议间隔搜索结果翻页5~8 秒进入详情页3~5 秒详情页内操作2~3 秒切换关键词搜索10 秒以上跑太快了容易触发验证码反而停半天。宁可慢一点稳定跑完。七、登录态管理TEMU 的登录态保持比国内电商短很多。如果你需要做后台数据采集订单、店铺数据登录态管理是必须的TEMU店群如何管理运营# 登录态检测打开网页(https://www.temu.com)等待(3秒)# 判断是否登录的标志判断元素是否存在(用户头像区域)如果 结果为假:# 未登录执行登录点击元素(登录入口)等待元素出现(登录弹窗,5秒)# TEMU登录支持邮箱和手机点击元素(邮箱登录Tab)输入文本(邮箱输入框,your_emailexample.com)输入文本(密码输入框,your_password)点击元素(登录按钮)等待元素出现(用户头像区域,15秒)# 等待登录完成否则:输出日志(已登录继续执行任务)Cookie 持久化在影刀浏览器的设置中开启记住登录状态这样不用每次都登录一次。八、多币种价格统一处理TEMU 面向全球不同地区显示不同币种。建议统一转成人民币或美元# 多币种转换表建议一个月更新一次汇率汇率表{USD:7.25,# 美元EUR:7.85,# 欧元GBP:9.15,# 英镑JPY:0.048,# 日元KRW:0.0055,# 韩元}价格识别的时候先判断币种符号再取对应的汇率换算。九、完整架构TEMU竞品监控系统# 主流程TEMU竞品价格监控主流程():关键词列表读取Excel(D:\TEMU数据\竞品关键词.xlsx,Sheet关键词)# 检查代理检查网络连通行()# 自定义子流程# 检查登录态检查并登录TEMU()遍历列表(关键词列表,当前关键词):# 搜索结果采集采集关键Top100商品()# 对比上一次价格与历史数据对比()# 如果有降价超过10%的商品记录告警筛选异常降价()# 生成报告生成竞品日报()# 推送飞书发送飞书卡片()十、常见坑与修复速查坑现象修复代理IP被TEMU拒绝页面打不开或显示异常换住宅IP降低采集频率登录态频繁过期跑几页就登出每次翻页后加判断自动重新登录价格格式不统一采集到的价格无法直接计算用正则统一清洗后再入库| 中文商品名乱码 | 英文系统采集中文 | URL参数加localezh强制中文 || 页面加载超时 | TEMU比国内慢 | 等待元素超时设为10~15秒 |内容标签#影刀RPA #TEMU自动化 #跨境电商 #数据采集 #RPA实操作者林焱本文为《影刀RPA学习手册》系列文章之一内容源于实操经验的整理与分享。