Yuan天空
Yuan天空
  • 我的主页
  • 博客随笔
  • 软件作品
    • TK精灵(进程守护)
    • 远程运维助手
    • DicomStoreSCU
    • TKOCR(离线OCR)
    • 更多...
  • 学习资源
  • 网址收藏
  • HTML模板
专注.NET开发技术领域
  1. 主页
  2. 博客
  3. 发布页

Applebot:今天才知道苹果也有自己的网络爬虫,如何屏蔽苹果的网络爬虫

AppleBot网络蜘蛛(Applebot)网络爬虫苹果也有自己的网络爬虫搜索引擎
博客随笔 2025-05-13 94

今天查看日志又发现有一个新的网络蜘蛛(Applebot)访问了网站,刚开始还以为是什么垃圾网络蜘蛛伪造苹果的网络爬虫,查了下才知道苹果居然还真有自己的网络爬虫

User-Agent Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15(KHTML, like Gecko) Version/17.4 Safari/605.1.15 (Applebot/0.1; +http://www.apple.com/go/applebot)

Applebot:今天才知道苹果也有自己的网络爬虫

Applebot 人隐私权说明

Applebot 模型训练和个人隐私权 - 官方 Apple 支持 (中国)

一直以来都以为苹果没有自己的网络爬虫,数据来源是利用了Bing或者Google等第三方搜索引擎来提供Siri、Spotlight等的搜索服务的。

目前看官网信息Applebot主要是为了抓取数据给苹果自家AI模型训练使用的,爬取我这边是什么时候开始的,可能注意力之前过于关注度娘 因而没有注意到。暂时看着Applebot网络爬虫访问量不是很多,对服务器压力不大就先不管了,万一哪天可以看到有苹果AI助理/苹果搜索的访问来源呢。

官方提到的Applebot抓取数据的一些用途

Applebot 抓取的数据用于为多项功能提供支持,例如集成到 Apple 生态系统内许多用户体验(包括“聚焦”、Siri 和 Safari 浏览器)中的搜索技术。在 robots.txt 中启用 Applebot 可让网站内容显示在世界各地的 Apple 用户使用这些产品获得的搜索结果中。 Applebot 抓取的数据还可用于协助训练 Apple 基础模型,这些模型为各种 Apple 产品(包括 Apple 智能、Apple 服务和 Apple 开发者工具)中的生成式 AI 功能提供支持。网页发布者可以选择在 robots.txt 文件中禁止 Applebot-Extended,以使自己的内容不被用于训练生成式基础模型。

同类文章
如何使用nslookup验证ip判断搜索引擎蜘蛛是否是伪造的百度蜘蛛
Loading...
如何使用nslookup验证ip判断搜索引擎蜘蛛是否是伪造的百度蜘蛛
[分享一下]网站两年多被拉黑不被bing搜索引擎收录的尝试到重新收录
Loading...
[分享一下]网站两年多被拉黑不被bing搜索引擎收录的尝试到重新收录
【博客沉浮】不知道是不是被百度K站了,又是悲伤的一天
Loading...
【博客沉浮】不知道是不是被百度K站了,又是悲伤的一天
今天网站被OpenAI网络爬虫高频率抓取,纠结要不要屏蔽OpenAI爬虫
Loading...
今天网站被OpenAI网络爬虫高频率抓取,纠结要不要屏蔽OpenAI爬虫
问题反馈/学习建议
1. 文明上网,理性表达,营造舒适的学习氛围
2. 请不要反馈提交与本页主题无关内容
学习资源
分布式网络爬虫的关键技术《网络爬虫全解析 技术、原理与实践.pdf》
Loading...
分布式网络爬虫的关键技术《网络爬虫全解析 技术、原理与实践.pdf》
标题目录
  • Applebot 人隐私权说明
  • 官方提到的Applebot抓取数据的一些用途