跳转到内容

PlanoTse 工作搜索自动化手册/发现所有网站域名

来自 Wikibooks,开放世界中的开放书籍
PlanoTse 工作搜索自动化手册
用例 发现所有网站域名 参考手册
Web Search Automation 跟踪日志示例
PlanoTseScript 第一课
PlanoTseScript 第二课

发现与我的搜索目标相关的网站域名

[编辑 | 编辑源代码]

此页面介绍了 PlanoTse 的一个用例。这个用例的目的是展示如何使用 PlanoTse 来发现与特定网络搜索目标相关的网站域名。

PlanoTse 的 0.0.47 版本是第一个有用的版本。它可以自动发现与特定搜索目标相关的网站域名。要获取该软件,请参阅此页面

 

问题陈述

[编辑 | 编辑源代码]

在这个示例中,我是一名住在President George Bush Turnpike (PGBT) 附近的技术作家,我想为一家位于这条高速公路上的公司工作。PGBT 穿越达拉斯的以下北部郊区:罗莱特、萨奇斯、加兰、理查森、普莱诺、卡罗尔顿、法默斯布ランチ、欧文和大草原。但是,我不希望在大草原或达拉斯市区工作。

 

示例解决方案

[编辑 | 编辑源代码]

搜索字符串

[编辑 | 编辑源代码]

我应该简化并一次只处理一个城市。现在,我选择普莱诺。我对 Google 的搜索字符串将是

Google: technical-writer + job-description + Plano -resume

实践步骤

[编辑 | 编辑源代码]

我执行以下步骤来达成我的解决方案

  • 步骤 1. 安装启动包数据
  • 步骤 2. 清除无模板域名
  • 步骤 3. 清除模板目录
  • 步骤 4. 设置 Go 脚本
  • 步骤 5. 测试 Go 脚本
  • 步骤 6. 开始生产
  • 步骤 7. 分析跟踪日志

 

 


步骤 1. 安装启动包数据

[编辑 | 编辑源代码]

如果您尚未安装启动包数据,您应该先进行此操作。这只需进行一次。

步骤 2. 清除无模板域名

[编辑 | 编辑源代码]

我使用以下步骤来重命名现有的无模板域名默认列表容器

  1. 选择菜单命令[文件 » 打开列表 » 网页]
  2. 在树状视图窗格中,查找标题为无模板域名的任何数据项。
  3. 如果未找到,请忽略以下步骤并结束此步骤。
  4. 单击数据项无模板域名,然后按 F2。
  5. 将其重命名为其他名称,例如无模板域名备份 101

在下一次网络搜索自动化 (WSA) 会话中,将创建一个新的数据项无模板域名,并将其用作保存所有新发现的域名列表的占位符。

步骤 3. 清除模板目录

[编辑 | 编辑源代码]

为了使 PlanoTse 认为每个 URL 都属于没有域名模板的域名,我确保将以下目录中的所有文件移动到其他位置

C:\Users\[your-account-name]\Documents\PlanoTseTools\PlanoTseScripting\UsefulURL\UsefulDomains

步骤 4. 设置 Go 脚本

[编辑 | 编辑源代码]

执行以下操作来设置 Go 脚本,以便我可以轻松地重复我的搜索过程

  1. 选择菜单命令[自动化 » Go 菜单 » 编辑 Go 脚本]
  2. 将 Go 脚本内容替换为
Go 脚本的新内容

{ clear responses;aw set mission Shreveport; aw set serializemissions yes;aw set timeout 15; aw set paddingseconds 10; aw set linkqsize 5; aw set serpqsize 4;aw set maxruns2;aw set level1domains com, net; web search Shreveport + job-description + technical-writer + -resume ; }

有关以分号结尾的每个 PlanoTseScript 命令的含义,请参阅PlanoTseScript WSA 命令,该命令位于PlanoTseScript 语言参考手册中。

如果您希望通过 Web Search Automation (WSA) 向导的菜单命令[自动化 » 网络搜索 » (停留在第 1 页)]来控制任务名称及其序列化,则应将这两个语句从上面的步骤 2 中删除aw set mission MyTestRun; aw set serializemissions yes;


 

步骤 5. 测试 Go 脚本

[edit | edit source]
  1. 关闭并退出 PlanoTse 应用程序。
  2. 重新启动 PlanoTse。
  3. 在主菜单上,点击 Go
  4. 等待网络搜索自动化 (WSA) 会话结束。
  5. 关闭搜索编辑器窗口。
  6. 选择菜单 [文件 » 打开列表 » 网页]
  7. 打开新生成的数据项,无模板域名
  8. 按窗口底部附近的 步骤 按钮。
  9. 如果您看到一个域名列表,那么您就成功了。

 

步骤 6. 开始生产

[edit | edit source]
  1. 修改 Go 脚本,并将命令中的 2 改为 0,即 set maxruns 0;
  2. 退出并重新启动 PlanoTse。
  3. 运行 Go 脚本。
  4. 上床睡觉,让脚本运行一整夜。
  5. 退出并重新启动 PlanoTse。
  6. 选择菜单 [文件 » 打开列表 » 网页]
  7. 打开新生成的数据项,无模板域名
  8. 按窗口底部附近的 步骤 按钮。
  9. 如果您看到一个很长的域名列表,那么您就成功了。

 

步骤 7. 分析跟踪日志

[edit | edit source]


 

使所有顶级域名失效

[edit | edit source]

使所有顶级域名失效是一个很好的技巧,可以获取与特定搜索目标相关的所有域名列表。使用以下 PlanoTseScript 命令在您的网络搜索自动化中使所有顶级域名失效

aw set level1domains abc, xyz;

 

以下示例跟踪日志显示了基于所有顶级域名失效的搜索结果。

 

顶级域名失效跟踪日志

6/9/2012 10:51:49 PM 1  [ScriptCode Length=104 Source=Script File 'default.tse' Software=PlanoTse 0.0.50]

6/9/2012 10:51:49 PM 2  Source Code: { aw set level1domains abc, xyz; web search automate-your-web-search mining-the-web PlanoTse-Handbook; }

6/9/2012 10:51:49 PM 3 {aw set level1domains abc, xyz}

6/9/2012 10:51:49 PM 4 {web search automate-your-web-search mining-the-web PlanoTse-Handbook}

6/9/2012 10:51:49 PM 5  PlanoTse 0.0.50

6/9/2012 10:51:50 PM 6  [文件 » 打开列表 » 网页]无用域名列表持有者 (14 个条目)网页 12335 NA 主要域名

6/9/2012 10:51:50 PM 7  [文件 » 打开列表 » 网页]无用域名列表持有者 (60 个条目)网页 12337 NA Google 域名

6/9/2012 10:51:50 PM 8 新无用域名持有者 (0 个条目)网页 16834 新 NA 域名

6/9/2012 10:51:50 PM 9 不需要的域名的总数74

6/9/2012 10:51:50 PM 10  [文件 » 打开列表 » 结果]无模板域名持有者 (0 个条目)结果 16968 手册 10223 无模板域名

6/9/2012 10:51:50 PM 11  [文件 » 打开列表 » 结果]不需要的顶级域名持有者 (0 个条目)结果 16969 手册 10223 不需要的顶级域名

6/9/2012 10:51:50 PM 12  只期望来自以下顶级域名的链接:abc, xyz

6/9/2012 10:51:50 PM 13  [文件 » 打开列表 » 网页]不需要的弹出标题持有者 (6 个条目)网页 15271 不需要的弹出标题

6/9/2012 10:51:50 PM 14 搜索编辑器菜单[结果 » 输出文件夹] C:\Users\Owner\Documents\PlanoTseTools\PlanoTseScripting\Temp\WebSearch\Handbook 10223

6/9/2012 10:51:50 PM 15  原始搜索字符串: -={automate-your-web-search mining-the-web PlanoTse-Handbook}=-

6/9/2012 10:51:50 PM 16  [自动化 » 网络搜索 » 预览页面]搜索结果页面队列大小40

6/9/2012 10:51:51 PM 17  [自动化 » 网络搜索 » 预览页面]链接队列大小80

6/9/2012 10:51:51 PM 18  [自动化 » 网络搜索 » 预览页面]互联网超时时间(秒):15

6/9/2012 10:51:51 PM 19  [自动化 » 网络搜索 » 预览页面]填充秒数:10

6/9/2012 10:51:51 PM 20  运行1搜索结果页面链接0-- 结果链接0-- 已处理链接0

6/9/2012 10:51:51 PM 21  浏览搜索结果页面www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook

6/9/2012 10:52:02 PM 22  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:02 PM 23  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:02 PM 24  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:02 PM 25  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:02 PM 26  顶级域名不需要:planotse.wordpress.com

6/9/2012 10:52:02 PM 27  顶级域名不需要:planotse.wordpress.com

6/9/2012 10:52:02 PM 28  顶级域名不需要:planotse.wordpress.com

6/9/2012 10:52:02 PM 29  顶级域名不需要:planotse.wordpress.com

6/9/2012 10:52:02 PM 30  顶级域名不需要:friendfeed.com

6/9/2012 10:52:02 PM 31  顶级域名不需要:friendfeed.com

6/9/2012 10:52:02 PM 32  顶级域名不需要:adwords[check spelling].google.com

6/9/2012 10:52:02 PM 33  搜索结果页面:10

6/9/2012 10:52:02 PM 34  搜索结果页面:20

6/9/2012 10:52:02 PM 35  搜索结果页面:30

6/9/2012 10:52:02 PM 36  搜索结果页面:40

6/9/2012 10:52:02 PM 37  搜索结果页面:50

6/9/2012 10:52:02 PM 38  搜索结果页面:60

6/9/2012 10:52:02 PM 39  搜索结果页面:70

6/9/2012 10:52:02 PM 40  搜索结果页面:80

6/9/2012 10:52:02 PM 41  搜索结果页面:90

6/9/2012 10:52:02 PM 42  收集了 9 个链接,请参见 Response16957.txt

6/9/2012 10:52:02 PM 43  移除了 52 个 N/A 链接,请参见 Response16957.RemovedLinks

6/9/2012 10:52:02 PM 44  在 11 秒内完成

6/9/2012 10:52:02 PM 45  最终 URL www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook

6/9/2012 10:52:02 PM 46 找到 9 个链接:9 个搜索结果页面链接和 0 个其他链接。

6/9/2012 10:52:02 PM 47  运行2搜索结果页面链接9-- 结果链接0-- 已处理链接1

6/9/2012 10:52:02 PM 48  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N

6/9/2012 10:52:11 PM 49  顶级域名不需要:wikibooks.7val.com

6/9/2012 10:52:11 PM 50  顶级域名不需要:net75633.blogspot.com

6/9/2012 10:52:11 PM 51  顶级域名不需要:friendfeed.com

6/9/2012 10:52:11 PM 52  顶级域名不需要:friendfeed.com

6/9/2012 10:52:11 PM 53  顶级域名不需要:www.feedage.com

6/9/2012 10:52:11 PM 54  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:11 PM 55  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:11 PM 56  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:11 PM 57  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:11 PM 58  收集了 1 个链接,请参见 Response16958.txt

6/9/2012 10:52:11 PM 59  移除了 37 个 N/A 链接,请参见 Response16958.RemovedLinks

6/9/2012 10:52:11 PM 60  在 8 秒内完成

6/9/2012 10:52:11 PM 61  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N

6/9/2012 10:52:11 PM 62 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

6/9/2012 10:52:11 PM 63  运行3搜索结果页面链接8-- 结果链接1-- 已处理链接2

6/9/2012 10:52:11 PM 64  浏览www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0

6/9/2012 10:52:19 PM 65  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 66  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 67  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 68  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 69  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 70  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 71  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 72  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 73  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 74  顶级域名不需要:en.wikibooks.org

6/9/2012 10:52:19 PM 75  顶级域名不需要:adwords.google.com

6/9/2012 10:52:19 PM 76  收集了 0 个链接,请参见 Response16959.txt

6/9/2012 10:52:19 PM 77  移除了 54 个 N/A 链接,请参见 Response16959.RemovedLinks

6/9/2012 10:52:19 PM 78  在 8 秒内完成

6/9/2012 10:52:19 PM 79  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0

6/9/2012 10:52:29 PM 80 没有找到链接

6/9/2012 10:52:29 PM 81  运行4搜索结果页面链接8-- 结果链接0-- 已处理链接3

6/9/2012 10:52:29 PM 82  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N

6/9/2012 10:52:37 PM 83  顶级域名不需要:wikibooks.7val.com

6/9/2012 10:52:37 PM 84  顶级域名不需要:net75633.blogspot.com

6/9/2012 10:52:37 PM 85  顶级域名不需要:friendfeed.com

6/9/2012 10:52:37 PM 86  顶级域名不需要:friendfeed.com

6/9/2012 10:52:37 PM 87  顶级域名不需要:www.feedage.com

6/9/2012 10:52:37 PM 88  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:37 PM 89  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:37 PM 90  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:37 PM 91  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:37 PM 92  收集了 1 个链接,请参见 Response16960.txt

6/9/2012 10:52:37 PM 93  移除了 37 个 N/A 链接,请参见 Response16960.RemovedLinks

6/9/2012 10:52:37 PM 94  在 8 秒内完成

6/9/2012 10:52:37 PM 95  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N

6/9/2012 10:52:40 PM 96 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

6/9/2012 10:52:40 PM 97  运行5搜索结果页面链接7-- 结果链接0-- 已处理链接4

6/9/2012 10:52:40 PM 98  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N

6/9/2012 10:52:49 PM 99  顶级域名不需要:wikibooks.7val.com

6/9/2012 10:52:49 PM 100  顶级域名不需要:net75633.blogspot.com

6/9/2012 10:52:49 PM 101  顶级域名不需要:friendfeed.com

6/9/2012 10:52:49 PM 102  顶级域名不需要:friendfeed.com

6/9/2012 10:52:49 PM 103  顶级域名不需要:www.feedage.com

6/9/2012 10:52:49 PM 104  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:49 PM 105  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:49 PM 106  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:49 PM 107  顶级域名不需要:netzonez93.koolcentre.in

6/9/2012 10:52:49 PM 108  收集了 1 个链接,请参见 Response16961.txt

6/9/2012 10:52:49 PM 109  移除了 37 个 N/A 链接,请参见 Response16961.RemovedLinks

6/9/2012 10:52:49 PM 110  在 8 秒内完成

2012年6月9日 下午10:52:49 111  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N

2012年6月9日 下午10:52:57 112 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:52:57 113  运行6搜索结果页面链接6-- 结果链接0-- 已处理链接5

2012年6月9日 下午10:52:57 114  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N

2012年6月9日 下午10:53:06 115  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:53:06 116  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:53:06 117  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:06 118  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:06 119  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:53:06 120  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:06 121  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:06 122  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:06 123  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:06 124  收集到1个链接,请查看Response16962.txt

2012年6月9日 下午10:53:06 125  删除了41个不相关的链接,请查看Response16962.RemovedLinks

2012年6月9日 下午10:53:06 126  在 8 秒内完成

2012年6月9日 下午10:53:06 127  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N

2012年6月9日 下午10:53:15 128 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:53:15 129  运行7搜索结果页面链接5-- 结果链接0-- 已处理链接6

2012年6月9日 下午10:53:15 130  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N

2012年6月9日 下午10:53:24 131  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:53:24 132  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:53:24 133  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:24 134  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:24 135  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:53:24 136  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:24 137  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:24 138  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:24 139  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:24 140  收集到1个链接,请查看Response16963.txt

2012年6月9日 下午10:53:24 141  删除了37个不相关的链接,请查看Response16963.RemovedLinks

2012年6月9日 下午10:53:24 142  9秒内完成

2012年6月9日 下午10:53:24 143  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N

2012年6月9日 下午10:53:28 144 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:53:28 145  运行8搜索结果页面链接4-- 结果链接0-- 已处理链接7

2012年6月9日 下午10:53:28 146  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N

2012年6月9日 下午10:53:37 147  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:53:37 148  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:53:37 149  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:37 150  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:37 151  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:53:37 152  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:37 153  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:37 154  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:37 155  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:37 156  收集到1个链接,请查看Response16964.txt

2012年6月9日 下午10:53:37 157  删除了37个不相关的链接,请查看Response16964.RemovedLinks

2012年6月9日 下午10:53:37 158  在 8 秒内完成

2012年6月9日 下午10:53:37 159  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N

2012年6月9日 下午10:53:44 160 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:53:44 161  运行9搜索结果页面链接3-- 结果链接0-- 已处理链接8

2012年6月9日 下午10:53:44 162  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N

2012年6月9日 下午10:53:53 163  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:53:53 164  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:53:53 165  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:53 166  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:53:53 167  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:53:53 168  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:53 169  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:53 170  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:53 171  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:53:53 172  收集到1个链接,请查看Response16965.txt

2012年6月9日 下午10:53:53 173  删除了37个不相关的链接,请查看Response16965.RemovedLinks

2012年6月9日 下午10:53:53 174  在 8 秒内完成

2012年6月9日 下午10:53:53 175  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N

2012年6月9日 下午10:54:00 176 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:54:00 177  运行10搜索结果页面链接2-- 结果链接0-- 已处理链接9

2012年6月9日 下午10:54:00 178  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N

2012年6月9日 下午10:54:08 179  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:54:08 180  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:54:08 181  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:54:08 182  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:54:08 183  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:54:08 184  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:08 185  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:08 186  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:08 187  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:08 188  收集到1个链接,请查看Response16966.txt

2012年6月9日 下午10:54:08 189  删除了37个不相关的链接,请查看Response16966.RemovedLinks

2012年6月9日 下午10:54:08 190  在 8 秒内完成

2012年6月9日 下午10:54:08 191  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N

2012年6月9日 下午10:54:16 192 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:54:16 193  运行11搜索结果页面链接1-- 结果链接0-- 已处理链接10

2012年6月9日 下午10:54:16 194  浏览搜索结果页面www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N

2012年6月9日 下午10:54:25 195  顶级域名不需要:wikibooks.7val.com

2012年6月9日 下午10:54:25 196  顶级域名不需要:net75633.blogspot.com

2012年6月9日 下午10:54:25 197  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:54:25 198  顶级域名不需要:friendfeed.com

2012年6月9日 下午10:54:25 199  顶级域名不需要:www.feedage.com

2012年6月9日 下午10:54:25 200  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:25 201  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:25 202  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:25 203  顶级域名不需要:netzonez93.koolcentre.in

2012年6月9日 下午10:54:25 204  收集到1个链接,请查看Response16967.txt

2012年6月9日 下午10:54:25 205  删除了37个不相关的链接,请查看Response16967.RemovedLinks

2012年6月9日 下午10:54:25 206  在 8 秒内完成

2012年6月9日 下午10:54:25 207  最终 URL www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N

2012年6月9日 下午10:54:31 208 找到 1 个链接:0 个搜索结果页面链接和 1 个其他链接。

2012年6月9日 下午10:54:31 209 
----- 11个处理过的链接的开始 -----

2012年6月9日 下午10:54:31 210  www.google.com/#output=search&q=automate-your-web-search mining-the-web PlanoTse-Handbook[automate-your-web-search mining-the-web PlanoTse-Handbook]

2012年6月9日 下午10:54:31 211  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=10&sa=N[2]

2012年6月9日 下午10:54:31 212  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&filter=0[重复搜索,包含省略的结果]

2012年6月9日 下午10:54:31 213  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=20&sa=N[3]

2012年6月9日 下午10:54:31 214  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=30&sa=N[4]

2012年6月9日 下午10:54:31 215  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=40&sa=N[5]

2012年6月9日 下午10:54:31 216  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=50&sa=N[6]

2012年6月9日 下午10:54:31 217  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=60&sa=N[7]

2012年6月9日 下午10:54:31 218  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=70&sa=N[8]

2012年6月9日 下午10:54:31 219  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=80&sa=N[9]

2012年6月9日 下午10:54:31 220  www.google.com/search?q=automate-your-web-search+mining-the-web+PlanoTse-Handbook&hl=en&prmd=imvns&start=90&sa=N[10]

2012年6月9日 下午10:54:31 221 ----- 11个处理过的链接的结束 -----

2012年6月9日 下午10:54:31 222 
----- 8个不需要的顶级域名的开始 -----

2012年6月9日 下午10:54:31 223  en.wikibooks.org

2012年6月9日 下午10:54:31 224  planotse.wordpress.com

2012年6月9日 下午10:54:31 225  friendfeed.com

2012年6月9日 下午10:54:31 226  adwords.google.com

2012年6月9日 下午10:54:31 227  wikibooks.7val.com

2012年6月9日 下午10:54:31 228  net75633.blogspot.com

2012年6月9日 下午10:54:31 229  www.feedage.com

2012年6月9日 下午10:54:31 230  netzonez93.koolcentre.in

2012年6月9日 下午10:54:31 231 ----- 8个不需要的顶级域名的结束 -----

2012年6月9日 下午10:54:31 232  PlanoTse 0.0.50


 

PlanoTse 工作搜索自动化手册
用例 发现所有网站域名 参考手册
华夏公益教科书