温馨提示:
本文最后更新于 2022-12-7,已超过半年没有更新,若内容或图片失效,请留言反馈。
百度收录分为快速收录和普通收录,快速收录只对部分优质站点开放,所以对于大多数人只能用普通收录。
普通收录方法有三种:API提交、sitemap、手动提交
tips:如何统计自己的网站有哪些页面?
百度sitemap在线生成:http://tools.bugscaner.com/sitemapspider ,输入自己的域名即可生成所有页面链接
1、API提交(蜘蛛访问最快)
使用说明
1、普通收录工具可以向百度搜索主动推送资源,缩短爬虫发现网站链接的时间,不保证收录和展现效果。
2、API提交和手动提交共享配额,每日至多提交10万条有价值的内容,sitemap提交配额不与其他方式共享,具体配额以站点页面显示数据为准 。配额不可累计,当日有效。
3、若链接存在跳转关系,请直接提交跳转后链接。如网站换域名,需提交新域名资源;进行HTTPS改造页面,请提交HTTPS资源。
调用地址:http://data.zz.baidu.com/urls?site=https://www.xx.com&token=xx
site:在搜索资源平台验证的站点,如www.example.com
token:在搜索资源平台申请的推送用的准入密钥
API提交Python代码
import requestsimport redef push_urls(url, urls): '''根据百度站长提供的API推送链接''' headers = { 'User-Agent': 'curl/7.12.1', 'Host': 'data.zz.baidu.com', 'Content - Type': 'text / plain', 'Content - Length': '83' } try: html = requests.post(url, headers=headers, data=urls, timeout=5).text return html except: return "{'error':404,'message':'请求超时,接口地址错误!'}"def get_urls(url): '''提取网站sitemap中所有链接,参数必须是sitemap的链接''' try: html = requests.get(url,timeout=5).text except: return 'miss' else: urls = re.findall('<loc>(.*?)</loc>', html) return '\n'.join(urls)
2、sitemap
百度sitemap在线生成:http://tools.bugscaner.com/sitemapspider ,输入自己的域名生成sitemap文件放在网页根目录,提交到百度收录即可。
3、手动提交
百度sitemap在线生成:http://tools.bugscaner.com/sitemapspider ,输入自己的域名生成html页面,提交所有页面即可。
评论一下?