PlanoTse 工作搜索自动化手册/发现所有网站域名
此页面介绍了 PlanoTse 的一个用例。这个用例的目的是展示如何使用 PlanoTse 来发现与特定网络搜索目标相关的网站域名。
PlanoTse 的 0.0.47 版本是第一个有用的版本。它可以自动发现与特定搜索目标相关的网站域名。要获取该软件,请参阅此页面。
在这个示例中,我是一名住在President George Bush Turnpike (PGBT) 附近的技术作家,我想为一家位于这条高速公路上的公司工作。PGBT 穿越达拉斯的以下北部郊区:罗莱特、萨奇斯、加兰、理查森、普莱诺、卡罗尔顿、法默斯布ランチ、欧文和大草原。但是,我不希望在大草原或达拉斯市区工作。
我想要的东西 一份拥有技术写作职位公司的域名列表,但必须位于罗莱特、萨奇斯、加兰、理查森、普莱诺、卡罗尔顿、法默斯布ランチ或欧文。 |
我应该简化并一次只处理一个城市。现在,我选择普莱诺。我对 Google 的搜索字符串将是
Google: technical-writer + job-description + Plano -resume
我执行以下步骤来达成我的解决方案
- 步骤 1. 安装启动包数据
- 步骤 2. 清除无模板域名
- 步骤 3. 清除模板目录
- 步骤 4. 设置 Go 脚本
- 步骤 5. 测试 Go 脚本
- 步骤 6. 开始生产
- 步骤 7. 分析跟踪日志
我需要做的事情 执行这些步骤。 |
如果您尚未安装启动包数据,您应该先进行此操作。这只需进行一次。
我使用以下步骤来重命名现有的无模板域名默认列表容器
- 选择菜单命令[文件 » 打开列表 » 网页]。
- 在树状视图窗格中,查找标题为无模板域名的任何数据项。
- 如果未找到,请忽略以下步骤并结束此步骤。
- 单击数据项无模板域名,然后按 F2。
- 将其重命名为其他名称,例如无模板域名备份 101。
在下一次网络搜索自动化 (WSA) 会话中,将创建一个新的数据项无模板域名,并将其用作保存所有新发现的域名列表的占位符。
为了使 PlanoTse 认为每个 URL 都属于没有域名模板的域名,我确保将以下目录中的所有文件移动到其他位置
C:\Users\[your-account-name]\Documents\PlanoTseTools\PlanoTseScripting\UsefulURL\UsefulDomains
执行以下操作来设置 Go 脚本,以便我可以轻松地重复我的搜索过程
- 选择菜单命令[自动化 » Go 菜单 » 编辑 Go 脚本]。
- 将 Go 脚本内容替换为
Go 脚本的新内容 { clear responses;aw set mission Shreveport; aw set serializemissions yes;aw set timeout 15; aw set paddingseconds 10; aw set linkqsize 5; aw set serpqsize 4;aw set maxruns2;aw set level1domains com, net; web search Shreveport + job-description + technical-writer + -resume ; } |
有关以分号结尾的每个 PlanoTseScript 命令的含义,请参阅PlanoTseScript WSA 命令,该命令位于PlanoTseScript 语言参考手册中。
如果您希望通过 Web Search Automation (WSA) 向导的菜单命令[自动化 » 网络搜索 » (停留在第 1 页)]来控制任务名称及其序列化,则应将这两个语句从上面的步骤 2 中删除aw set mission MyTestRun; aw set serializemissions yes;
在早期版本中,PlanoTse 无法运行上述 Go 脚本多次。您必须退出并重新启动 PlanoTse,然后重试。问题涉及搜索编辑器的使用。 |
步骤 5. 测试 Go 脚本
[edit | edit source]- 关闭并退出 PlanoTse 应用程序。
- 重新启动 PlanoTse。
- 在主菜单上,点击 Go。
- 等待网络搜索自动化 (WSA) 会话结束。
- 关闭搜索编辑器窗口。
- 选择菜单 [文件 » 打开列表 » 网页]。
- 打开新生成的数据项,无模板域名。
- 按窗口底部附近的 步骤 按钮。
- 如果您看到一个域名列表,那么您就成功了。
步骤 6. 开始生产
[edit | edit source]- 修改 Go 脚本,并将命令中的 2 改为 0,即 set maxruns 0;。
- 退出并重新启动 PlanoTse。
- 运行 Go 脚本。
- 上床睡觉,让脚本运行一整夜。
- 退出并重新启动 PlanoTse。
- 选择菜单 [文件 » 打开列表 » 网页]。
- 打开新生成的数据项,无模板域名。
- 按窗口底部附近的 步骤 按钮。
- 如果您看到一个很长的域名列表,那么您就成功了。
步骤 7. 分析跟踪日志
[edit | edit source]如何分析 WSA 跟踪日志 参见 网络搜索自动化跟踪日志示例。 |
使所有顶级域名失效
[edit | edit source]使所有顶级域名失效是一个很好的技巧,可以获取与特定搜索目标相关的所有域名列表。使用以下 PlanoTseScript 命令在您的网络搜索自动化中使所有顶级域名失效
aw set level1domains abc, xyz;
以下示例跟踪日志显示了基于所有顶级域名失效的搜索结果。
顶级域名失效跟踪日志 6/9/2012 10:51:49 PM 1 [ScriptCode Length=104 Source=Script File 'default.tse' Software=PlanoTse 0.0.50] 6/9/2012 10:51:49 PM 2 Source Code: { aw set level1domains abc, xyz; web search automate-your-web-search mining-the-web PlanoTse-Handbook; } 6/9/2012 10:51:49 PM 3 {aw set level1domains abc, xyz} 6/9/2012 10:51:49 PM 4 {web search automate-your-web-search mining-the-web PlanoTse-Handbook} 6/9/2012 10:51:49 PM 5 PlanoTse 0.0.50 6/9/2012 10:51:50 PM 6 [文件 » 打开列表 » 网页]无用域名列表持有者 (14 个条目)网页 12335 NA 主要域名 6/9/2012 10:51:50 PM 7 [文件 » 打开列表 » 网页]无用域名列表持有者 (60 个条目)网页 12337 NA Google 域名 6/9/2012 10:51:50 PM 8 新无用域名持有者 (0 个条目)网页 16834 新 NA 域名 6/9/2012 10:51:50 PM 9 不需要的域名的总数74 6/9/2012 10:51:50 PM 10 [文件 » 打开列表 » 结果]无模板域名持有者 (0 个条目)结果 16968 手册 10223 无模板域名 6/9/2012 10:51:50 PM 11 [文件 » 打开列表 » 结果]不需要的顶级域名持有者 (0 个条目)结果 16969 手册 10223 不需要的顶级域名 6/9/2012 10:51:50 PM 12 只期望来自以下顶级域名的链接:abc, xyz 6/9/2012 10:51:50 PM 13 [文件 » 打开列表 » 网页]不需要的弹出标题持有者 (6 个条目)网页 15271 不需要的弹出标题 6/9/2012 10:51:50 PM 14 搜索编辑器菜单[结果 » 输出文件夹] C:\Users\Owner\Documents\PlanoTseTools\PlanoTseScripting\Temp\WebSearch\Handbook 10223 6/9/2012 10:51:50 PM 15 原始搜索字符串: -={automate-your-web-search mining-the-web PlanoTse-Handbook}=- 6/9/2012 10:51:50 PM 16 [自动化 » 网络搜索 » 预览页面]搜索结果页面队列大小40 6/9/2012 10:51:51 PM 17 [自动化 » 网络搜索 » 预览页面]链接队列大小80 6/9/2012 10:51:51 PM 18 [自动化 » 网络搜索 » 预览页面]互联网超时时间(秒):15 6/9/2012 10:51:51 PM 19 [自动化 » 网络搜索 » 预览页面]填充秒数:10 6/9/2012 10:51:51 PM 20 运行1搜索结果页面链接0-- 结果链接0-- 已处理链接0 6/9/2012 10:51:51 PM 21 浏览搜索结果页面www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook 6/9/2012 10:52:02 PM 22 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:02 PM 23 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:02 PM 24 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:02 PM 25 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:02 PM 26 顶级域名不需要:planotse.wordpress.com 6/9/2012 10:52:02 PM 27 顶级域名不需要:planotse.wordpress.com 6/9/2012 10:52:02 PM 28 顶级域名不需要:planotse.wordpress.com 6/9/2012 10:52:02 PM 29 顶级域名不需要:planotse.wordpress.com 6/9/2012 10:52:02 PM 30 顶级域名不需要:friendfeed.com 6/9/2012 10:52:02 PM 31 顶级域名不需要:friendfeed.com 6/9/2012 10:52:02 PM 32 顶级域名不需要:adwords[check spelling].google.com 6/9/2012 10:52:02 PM 33 搜索结果页面:10 6/9/2012 10:52:02 PM 34 搜索结果页面:20 6/9/2012 10:52:02 PM 35 搜索结果页面:30 6/9/2012 10:52:02 PM 36 搜索结果页面:40 6/9/2012 10:52:02 PM 37 搜索结果页面:50 6/9/2012 10:52:02 PM 38 搜索结果页面:60 6/9/2012 10:52:02 PM 39 搜索结果页面:70 6/9/2012 10:52:02 PM 40 搜索结果页面:80 6/9/2012 10:52:02 PM 41 搜索结果页面:90 6/9/2012 10:52:02 PM 42 收集了 9 个链接,请参见 Response16957.txt 6/9/2012 10:52:02 PM 43 移除了 52 个 N/A 链接,请参见 Response16957.RemovedLinks 6/9/2012 10:52:02 PM 44 在 11 秒内完成 6/9/2012 10:52:02 PM 45 最终 URL www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook 6/9/2012 10:52:02 PM 46 找到 9 个链接:9 个搜索结果页面链接和 0 个其他链接。 6/9/2012 10:52:02 PM 47 运行2搜索结果页面链接9-- 结果链接0-- 已处理链接1 6/9/2012 10:52:02 PM 48 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N 6/9/2012 10:52:11 PM 49 顶级域名不需要:wikibooks.7val.com 6/9/2012 10:52:11 PM 50 顶级域名不需要:net75633.blogspot.com 6/9/2012 10:52:11 PM 51 顶级域名不需要:friendfeed.com 6/9/2012 10:52:11 PM 52 顶级域名不需要:friendfeed.com 6/9/2012 10:52:11 PM 53 顶级域名不需要:www.feedage.com 6/9/2012 10:52:11 PM 54 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:11 PM 55 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:11 PM 56 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:11 PM 57 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:11 PM 58 收集了 1 个链接,请参见 Response16958.txt 6/9/2012 10:52:11 PM 59 移除了 37 个 N/A 链接,请参见 Response16958.RemovedLinks 6/9/2012 10:52:11 PM 60 在 8 秒内完成 6/9/2012 10:52:11 PM 61 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N 6/9/2012 10:52:11 PM 62 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 6/9/2012 10:52:11 PM 63 运行3搜索结果页面链接8-- 结果链接1-- 已处理链接2 6/9/2012 10:52:11 PM 64 浏览www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0 6/9/2012 10:52:19 PM 65 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 66 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 67 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 68 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 69 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 70 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 71 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 72 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 73 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 74 顶级域名不需要:en.wikibooks.org 6/9/2012 10:52:19 PM 75 顶级域名不需要:adwords.google.com 6/9/2012 10:52:19 PM 76 收集了 0 个链接,请参见 Response16959.txt 6/9/2012 10:52:19 PM 77 移除了 54 个 N/A 链接,请参见 Response16959.RemovedLinks 6/9/2012 10:52:19 PM 78 在 8 秒内完成 6/9/2012 10:52:19 PM 79 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0 6/9/2012 10:52:29 PM 80 没有找到链接 6/9/2012 10:52:29 PM 81 运行4搜索结果页面链接8-- 结果链接0-- 已处理链接3 6/9/2012 10:52:29 PM 82 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N 6/9/2012 10:52:37 PM 83 顶级域名不需要:wikibooks.7val.com 6/9/2012 10:52:37 PM 84 顶级域名不需要:net75633.blogspot.com 6/9/2012 10:52:37 PM 85 顶级域名不需要:friendfeed.com 6/9/2012 10:52:37 PM 86 顶级域名不需要:friendfeed.com 6/9/2012 10:52:37 PM 87 顶级域名不需要:www.feedage.com 6/9/2012 10:52:37 PM 88 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:37 PM 89 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:37 PM 90 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:37 PM 91 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:37 PM 92 收集了 1 个链接,请参见 Response16960.txt 6/9/2012 10:52:37 PM 93 移除了 37 个 N/A 链接,请参见 Response16960.RemovedLinks 6/9/2012 10:52:37 PM 94 在 8 秒内完成 6/9/2012 10:52:37 PM 95 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N 6/9/2012 10:52:40 PM 96 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 6/9/2012 10:52:40 PM 97 运行5搜索结果页面链接7-- 结果链接0-- 已处理链接4 6/9/2012 10:52:40 PM 98 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N 6/9/2012 10:52:49 PM 99 顶级域名不需要:wikibooks.7val.com 6/9/2012 10:52:49 PM 100 顶级域名不需要:net75633.blogspot.com 6/9/2012 10:52:49 PM 101 顶级域名不需要:friendfeed.com 6/9/2012 10:52:49 PM 102 顶级域名不需要:friendfeed.com 6/9/2012 10:52:49 PM 103 顶级域名不需要:www.feedage.com 6/9/2012 10:52:49 PM 104 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:49 PM 105 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:49 PM 106 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:49 PM 107 顶级域名不需要:netzonez93.koolcentre.in 6/9/2012 10:52:49 PM 108 收集了 1 个链接,请参见 Response16961.txt 6/9/2012 10:52:49 PM 109 移除了 37 个 N/A 链接,请参见 Response16961.RemovedLinks 6/9/2012 10:52:49 PM 110 在 8 秒内完成 2012年6月9日 下午10:52:49 111 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N 2012年6月9日 下午10:52:57 112 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:52:57 113 运行6搜索结果页面链接6-- 结果链接0-- 已处理链接5 2012年6月9日 下午10:52:57 114 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N 2012年6月9日 下午10:53:06 115 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:53:06 116 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:53:06 117 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:06 118 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:06 119 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:53:06 120 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:06 121 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:06 122 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:06 123 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:06 124 收集到1个链接,请查看Response16962.txt 2012年6月9日 下午10:53:06 125 删除了41个不相关的链接,请查看Response16962.RemovedLinks 2012年6月9日 下午10:53:06 126 在 8 秒内完成 2012年6月9日 下午10:53:06 127 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N 2012年6月9日 下午10:53:15 128 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:53:15 129 运行7搜索结果页面链接5-- 结果链接0-- 已处理链接6 2012年6月9日 下午10:53:15 130 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N 2012年6月9日 下午10:53:24 131 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:53:24 132 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:53:24 133 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:24 134 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:24 135 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:53:24 136 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:24 137 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:24 138 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:24 139 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:24 140 收集到1个链接,请查看Response16963.txt 2012年6月9日 下午10:53:24 141 删除了37个不相关的链接,请查看Response16963.RemovedLinks 2012年6月9日 下午10:53:24 142 9秒内完成 2012年6月9日 下午10:53:24 143 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N 2012年6月9日 下午10:53:28 144 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:53:28 145 运行8搜索结果页面链接4-- 结果链接0-- 已处理链接7 2012年6月9日 下午10:53:28 146 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N 2012年6月9日 下午10:53:37 147 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:53:37 148 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:53:37 149 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:37 150 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:37 151 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:53:37 152 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:37 153 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:37 154 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:37 155 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:37 156 收集到1个链接,请查看Response16964.txt 2012年6月9日 下午10:53:37 157 删除了37个不相关的链接,请查看Response16964.RemovedLinks 2012年6月9日 下午10:53:37 158 在 8 秒内完成 2012年6月9日 下午10:53:37 159 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N 2012年6月9日 下午10:53:44 160 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:53:44 161 运行9搜索结果页面链接3-- 结果链接0-- 已处理链接8 2012年6月9日 下午10:53:44 162 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N 2012年6月9日 下午10:53:53 163 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:53:53 164 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:53:53 165 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:53 166 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:53:53 167 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:53:53 168 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:53 169 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:53 170 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:53 171 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:53:53 172 收集到1个链接,请查看Response16965.txt 2012年6月9日 下午10:53:53 173 删除了37个不相关的链接,请查看Response16965.RemovedLinks 2012年6月9日 下午10:53:53 174 在 8 秒内完成 2012年6月9日 下午10:53:53 175 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N 2012年6月9日 下午10:54:00 176 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:54:00 177 运行10搜索结果页面链接2-- 结果链接0-- 已处理链接9 2012年6月9日 下午10:54:00 178 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N 2012年6月9日 下午10:54:08 179 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:54:08 180 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:54:08 181 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:54:08 182 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:54:08 183 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:54:08 184 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:08 185 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:08 186 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:08 187 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:08 188 收集到1个链接,请查看Response16966.txt 2012年6月9日 下午10:54:08 189 删除了37个不相关的链接,请查看Response16966.RemovedLinks 2012年6月9日 下午10:54:08 190 在 8 秒内完成 2012年6月9日 下午10:54:08 191 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N 2012年6月9日 下午10:54:16 192 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 2012年6月9日 下午10:54:16 193 运行11搜索结果页面链接1-- 结果链接0-- 已处理链接10 2012年6月9日 下午10:54:16 194 浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N 2012年6月9日 下午10:54:25 195 顶级域名不需要:wikibooks.7val.com 2012年6月9日 下午10:54:25 196 顶级域名不需要:net75633.blogspot.com 2012年6月9日 下午10:54:25 197 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:54:25 198 顶级域名不需要:friendfeed.com 2012年6月9日 下午10:54:25 199 顶级域名不需要:www.feedage.com 2012年6月9日 下午10:54:25 200 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:25 201 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:25 202 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:25 203 顶级域名不需要:netzonez93.koolcentre.in 2012年6月9日 下午10:54:25 204 收集到1个链接,请查看Response16967.txt 2012年6月9日 下午10:54:25 205 删除了37个不相关的链接,请查看Response16967.RemovedLinks 2012年6月9日 下午10:54:25 206 在 8 秒内完成 2012年6月9日 下午10:54:25 207 最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N 2012年6月9日 下午10:54:31 208 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。 ----- 11个处理过的链接的开始 ----- 2012年6月9日 下午10:54:31 210 www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook[automate-your-web-search mining-the-web PlanoTse-Handbook] 2012年6月9日 下午10:54:31 211 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N[2] 2012年6月9日 下午10:54:31 212 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0[重复搜索,包含省略的结果] 2012年6月9日 下午10:54:31 213 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N[3] 2012年6月9日 下午10:54:31 214 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N[4] 2012年6月9日 下午10:54:31 215 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N[5] 2012年6月9日 下午10:54:31 216 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N[6] 2012年6月9日 下午10:54:31 217 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N[7] 2012年6月9日 下午10:54:31 218 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N[8] 2012年6月9日 下午10:54:31 219 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N[9] 2012年6月9日 下午10:54:31 220 www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N[10] 2012年6月9日 下午10:54:31 221 ----- 11个处理过的链接的结束 ----- ----- 8个不需要的顶级域名的开始 ----- 2012年6月9日 下午10:54:31 223 en.wikibooks.org 2012年6月9日 下午10:54:31 224 planotse.wordpress.com 2012年6月9日 下午10:54:31 225 friendfeed.com 2012年6月9日 下午10:54:31 226 adwords.google.com 2012年6月9日 下午10:54:31 227 wikibooks.7val.com 2012年6月9日 下午10:54:31 228 net75633.blogspot.com 2012年6月9日 下午10:54:31 229 www.feedage.com 2012年6月9日 下午10:54:31 230 netzonez93.koolcentre.in 2012年6月9日 下午10:54:31 231 ----- 8个不需要的顶级域名的结束 ----- 2012年6月9日 下午10:54:31 232 PlanoTse 0.0.50
|