<?xml version="1.0" encoding="gb2312"?>

<!-- RSS generated by oioj.net on 4/16/2004 ; 感谢LeXRus提供 RSS 2.0 文档; 此文件可自由使用，但请保留此行信息 --> 
<!-- Source download URL: http://blogger.org.cn/blog/rss2.asp       -->
<rss version="2.0">

<channel>
<title>信息采集高手</title>
<link>http://blogger.org.cn/blog/blog.asp?name=Webextraction</link>
<description>信息采集高手的博客</description>
<copyright>blogger.org.cn</copyright>
<generator>W3CHINA Blog</generator>
<webMaster>webmaster@blogger.org.cn</webMaster>
<item>
<title><![CDATA[怎样利用信息技术收集网络文献]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41409</link>
<author>Webextraction</author>
<pubDate>2008/11/27 16:36:33</pubDate>
<description><![CDATA[<a>　&nbsp;&nbsp;
　网络文献收集工作是一项十分复杂的工作，它需要涉及各种各样的知识领域，面临无边无际的网络文献海洋，接触五花八门、专业水平参差不齐的文献生产机构和
纵横交错、形如迷宫的文献发行网络，要在茫茫的因特网上寻找到一定数量的价值高、针对性强的文献，犹如大海捞针，沙里淘金，因而，我们在</a><a href="http://www.knowlesys.cn/" target="_blank">收集网络文献</a>时要遵循一定的原则，利用适当的方法和技术。<br>
<br>
（一）、 网络文献收集要以用户需求为第一原则。<br>
<br>
<strong><a href="http://www.knowlesys.cn/" target="_blank">网络文献收集</a></strong>的主要目的，有时甚至是唯一的目的，就是满足社会需求，也就是满足用户提出的文献需求。网络文献收集应以此需求为其出发点和归宿。因此，网络文献收集应以用户需求为第一标准，也就是说，网络文献收集要以其利用为基础。<br>
<br>
网络文献是提供给因特网上所有用户利用的，因此，网络文献收集的出发点不应只放在现实用户的现实需求上，还应该考虑现实用户的潜在需求，或者说是未来需求，以及潜在用户的可能需求。所收集到的文献要能够反映全社会潜在的所有用户的广泛兴趣。<br>
<br>
不同的用户对文献有不同的需求，用户的职业、文化层次、个性特征都会影响他们对文献的需求层次和利用方式。因而网络文献收集还要了解不同用户乃至不同用户群的需求层次，需求变化情况，以增强文献收集的目的性和针对性。<br>
<br>
当然，文献收集所考虑的用户需求是用户的正当合理需求，而不是居心叵测甚至低级趣味的需求。在网络文献收集中，应把后者与低层次但正当的需求，以及为特殊目的所提出的需求区别开来。<br>
<br>
（二）、 网络文献收集的方法和技术<br>
<br>
目前，常规的网络文献收集技术是计算机联机检索，它是从传统的手工检索发展而来的。计算机检索系统有很多的优点，如查找速度更快、更容易查全和查准等，尤
其是联机检索，扩大了查找范围，更能查到所需的文献。联机检索这一现代化的网络收集手段，能使人们坐在计算机前，不受空间和地域的限制，在很短的时间内，
就可通过人机对话的方式收集到大量有用的文献信息。我国从1983年10月建立第一台联机终端以来，已与国际上20多个联机检索系统相连。通过联机检索，
国内广大用户在申报专利和科研成果鉴定、新产品开发和投产、技术引进和合资办厂、开拓新的研究领域和确定新的研究课题等方面收集到大量信息，取得了明显的
效果。现在，各国都在建设各种类型的大量的数据库，各联机检索系统连接成网，这种联机、联网的发展势头，将使我们只要上了因特网，就可收集到所需的世界范
围内的文献信息。<br>
<br>
为了减少获取网络文献存放地址的困难和复杂的操作指令，我们可利用WWW、WAIS、Gopher等信息检索工具进行网络文献的收集。在具体收集时，应运用多种途径手段，还应本着为用户负责的态度，从科学新颖性、实用经济性等方面注意鉴别选择。比如<a href="http://www.knowlesys.cn/" target="_blank">乐思网络文献搜集系统</a>，作为专门的和最通用的网络文献采集工具，它采集的数据完整、及时，另外，还符合我们要求的任意网站都能采集的目标。]]></description>
</item><item>
<title><![CDATA[利用网络收集，为案件找到更多的线索]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41407</link>
<author>Webextraction</author>
<pubDate>2008/11/27 16:23:29</pubDate>
<description><![CDATA[&nbsp;&nbsp;&nbsp;&nbsp;  在8月3日，海南省监察厅开通了网上信访举报和案件<a href="http://www.knowlesys.cn/cn/products.htm" target="_blank">线索收集</a>。<br>
  &nbsp;&nbsp;  它的开通，标志着我省纪检监察机关信访举报 工作由过去单一的举报方式，向运用现代网络科技方向发展。网络技术的及时性和快捷性，有利于降低举报成本，提高信访工作效率；网络技术的直接性，大大减少 了举报信息到达纪检监察机关的沟通环节。<br>
&nbsp;&nbsp;&nbsp;&nbsp;  利用网络这个平台，进行信访接待，收集案件线索，了解群众呼声，化解社会矛盾，对于加强党风廉政建设、构建社会主 义和谐社会具有重要意义。网络上的信息是非常丰富和自由的，里面包含着各个层面发来的不同声音，只要有效的<a href="http://www.knowlesys.cn/cn/services.htm" target="_blank">搜集和整理</a>好它们，就可以在其中获得许多有价值的信息，甚至很多在传统领域无法得到的高价值资源。比如，某个案件一直的不到突破时，利用<a href="http://www.knowlesys.cn/" target="_blank">乐思</a><a href="http://www.knowlesys.cn/cn/products.htm" target="_blank">信息采集</a>。从网上各大论坛、BLOG中去搜集相关信息，就有可能找到一些相关知情人留下的信息，为案子找到突破口。这点从我们常见的‘人肉搜索’的力量中就可以发现到网络信息的力量。]]></description>
</item><item>
<title><![CDATA[中小企业站点的seo绝招]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41406</link>
<author>Webextraction</author>
<pubDate>2008/11/27 15:44:37</pubDate>
<description><![CDATA[<a>　我一直觉得对于sem/seo的需求，中小企业站点跟大型企业，大型网站特别是那些本身就依靠经营网站为主要业务的企业来说，有着非常明显的区别。<br>
<br>
首先，中小企业的站点很简单。一般在几十个页面以内。大部分甚至只有十个页面左右。站点的栏目几乎就是公司介绍，产品展示，新闻动态，在线表单，联系我们等。而相比大型站点的内容和栏目及页面的丰富性，这一类小站点似乎在实施seo存在天然的内容不足。<br>
<br>
其次，这些小站点，几乎第一次做上去之后就很少更新。对于优化来说这也是一个非常不利的因素。而且这些站点在当初设计的时候，有的甚至就根本没有考虑到要
经常更新，即使有心帮助他们更新站点内容，也不得不先在站点增加对应的栏目或板块。有的虽然有新闻动态之类的可以经常更新，但所处行业有时候网上相关的资
讯实在有限，找内容也不是一件容易的事情。<br>
<br>
再者，中小企业站点针对的关键词更为集中。特别是一些生产某一具体产品的企业。有时候真正非常相关的关键词估计只在十几个，更核心的甚至就那么二三个。这
样的站点在实施seo时，这些核心关键词的最终排名对于企业非常重要。不象一些大型站点，检索关键词范围要广得多，有的甚至以万为单位来计算。这样具体某
一些关键词的排名高低并不重要，最重要的整体效果。<br>
<br>
而且，中小企业不象大型公司和站点那样，有专门的团队来管理站点。所以很多的具体搜索引擎优化服务实施都必须依靠服务提供方来操作。这样站用了太多专业人
员的时间。让一些优秀的seo/sem人才整天帮助这些小站点做一些简单的基础工作，人力成本太高。
大站点对员工的相应培训，能产生非常大作用。对中小企业的seo服务，这一块几乎就用不上场了。<br>
<br>
最后还必须强调一点的是，大型站点和企业由于有相对比较专业的人员存在，对seo
的理解和接受能力要高于一般的中小企业人员。特别是传统企业的人员，根本就别奢望其对seo有很深的了解和理解。他们之所以选择seo服务，更多的是因为
事先所说的效果。这样导致的后果就是，他们在整个服务过程中，都会反复执泥于具体效果的一些量化指标，比如关键词的排名到了那里之类的。<br>
<br>
虽然很多人甚至认为中小企业不是seo服务的首选服务对象，但对于中小企业站点的seo服务怎么做这个问题的思考，是非常有意义的。石头幸运的是在这方面
积累了大量成功的或者失败的案例和经验。近段时间将重点思考和关注中小企业seo服务的模式和经验总结。也欢迎许多正在与中小企业打交道，第一线的
seo人员，大家一起来探讨。<br>
<br>
<br>
<font size="3">更多相关资料搜集：<a href="http://www.knowlesys.cn/cn/products.htm" target="_blank">乐思网络信息采集</a></font></a>]]></description>
</item><item>
<title><![CDATA[我的网站推广20法]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41405</link>
<author>Webextraction</author>
<pubDate>2008/11/27 15:41:24</pubDate>
<description><![CDATA[<a>　&nbsp;&nbsp;&nbsp;  汇集前辈高人以及自己多年的网站推广经验，集天下之大成，精选出网站推广20大法。希望对互联网创业的新手有所启发。<br>

<br>

1.搜索引擎推广 登陆搜索引擎，如google，百度，Yahoo等。当然，要想在搜索引擎上有比较好的排名，这首先要你的网站有内容，能及时更新，也要进行SEO（搜索引擎优化）。<br>

<br>

2.论坛推广 在目标受众经常浏览的网站、论坛发帖。发贴子不是广告，而是能吸引对方到你的网站上来的有价值信息。比如你可以设置签名。<br>

<br>

3. Email营销推广 花几百元买一个群发软件系统。针对目标受众，发送信息。注意一点，标题要吸引人、简单明了，不要欺骗别人。<br>

<br>

4.导航网站登录 可以登陆导航网站。例如，hao123和265 如果不够资格，花几万元买一个月首页推荐。<br>

<br>

5.资源合作推广 通过网站互弹，交换链接、交换广告、内容合作、用户资源合作等方式，在具有类似目标网站之间实现互相推广的目的，其中最常用的方式为网站链接。<br>

<br>

6.投放广告 到门户网站或者其它专业网站投放广告宣传。如果实力强还可以在传统媒体上刊登广告，如电视、报刊等。像公交车、地铁等广告方式也越来越受网站欢迎。<br>

<br>

7.信息发布推广 如果你的网站是电子商务网站，那就到分类信息网站、黄页网站等发布信息。<br>

<br>

8.博客推广。这是比较新颖的推广方式。注册国内主要博客网站，然后发布吸引人的信息，吸引其它用户链接。同时博客很受搜索引擎欢迎，所以你在博客上推广的网站也会信息推广。<br>

<br>

9.获取访问者的e-mail地址，并根据其要求发送信息。可以吸引他下次来访。<br>

<br>

10.关键词、竞价排名推广。买几个搜索引擎的的关键词进行推广。这需要比较大的投入。<br>

<br>

11.加入广告联盟。目前国内有很多广告联盟可以自行选择加入。<br>

<br>

12.病毒式营销。并非篡改浏览者首页，而是通过制作包含有自身网站信息的精美网页、电子书、软件、FLASH作品、贺卡、即时聊天工具等工具和内容。<br>

<br>

13.通用网址、网络实名推广。对于习惯于使用中文的用户来说，用户只需输入中文网址就可以访问网站。<br>

<br>

14.建立吸引人的特色栏目。比如猫扑的特色栏目就是大杂烩。<br>

<br>

15.活动宣传。可以联合其它同类网站搞网络比赛，吸引人气。当然，如果有实力，也可以联合传统媒体搞活动。<br>

<br>

16.有奖参与。通过注册有奖、有奖竞猜、在线优惠卷、有奖调查等方式吸引人。<br>

<br>

17.安装插件。安装插件提升网站流量的很好方式。很多知名网站都有安装插件。当然也有霸道的强制安装。<br>

<br>

18.制造新闻爆炸点。猫扑和天涯的炒作成长历程是很值得新网站学习的。像最近中了500万大奖的林美眉也使500wan.com一夜成名。<br>

<br>

19.制作辅助网站。你可以制作多个关联网站辅助推广主网站。<br>

<br>

20.域名指向。如果资源足够，还可以使用域名指向。<br>

<br>

<br>

 
 
 
 
 <span style="font-size: 10.5pt;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;  </span><span style="font-size: 18pt;">信息来源：</span></a><a href="http://www.knowlesys.cn/" target="_blank">乐思采集</a><br>&nbsp;&nbsp;&nbsp;
  学习资源：<span style="font-size: 18pt;"><a target="_blank" href="http://www.knowlesys.cn/cn/tutorial/examples/"><span><span>采集实例</span></span></a></span><span style="font-size: 10.5pt;"><br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span style="font-size: 18pt;">免费软件下载：</span><span style="font-size: 18pt;"><a target="_blank" href="http://www.knowlesys.cn/cn/resource.htm"><span><span>乐思信息采集下载</span></span></a></span>]]></description>
</item><item>
<title><![CDATA[整合营销--现代营销的发展方向]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41404</link>
<author>Webextraction</author>
<pubDate>2008/11/27 15:19:12</pubDate>
<description><![CDATA[<a>　<strong title="网页数据抓取,网站内容抓取">什么是网络</strong></a><a href="http://www.knowlesys.cn/intergration-marketing.htm" target="_blank"><strong>整合营销</strong></a><strong title="网页数据抓取,网站内容抓取">?</strong>                  <br>
<a href="http://www.knowlesys.cn/intergration-marketing.htm" target="_blank"><strong>整合营销</strong></a>整
合营销传播是上个世纪90年代以来在西方风行的营销理念和方法。它与传统营销“以产品为中心”相比，更强调“以客户为中心”；它强调营销即是传播，即和客
户多渠道沟通，和客户建立起品牌关系。与传统营销4P相比，整合营销传播理论的核心是4C：即相应于“产品”，要求关注客户的需求和欲望
（consumerwantsandneeds），提供能满足客户需求和欲望的产品；相应于“价格”，要求关注客户为了满足自己需求和欲望所可能的支付成
本（cost）；相应于“渠道”，要求考虑客户购买的便利性（convenience）；相应于“促销”，要求注重和客户的沟通 （communica
tion）。<br>
<br>
<strong title="网页数据抓取,网站内容抓取, 新闻抓取">整合营销中的一个重要工具是<a href="http://www.knowlesys.cn/cn/products.htm" target="_blank">数据库营销</a>，也就是利用潜在用户数据库，通过各种活动，建立或加强与客户的联系。<br>
<br>
在目前的因特网上，有大量的潜在用户或公司的信息，例如Yahoo目录中的汽车爱好者群组，博客中的自驾车圈子等。<br>
<br>
利用<a href="http://www.knowlesys.cn/cn/services.htm" target="_blank">网络信息采集</a>可以</strong>将非结构化的信息从大量的网页中抽取出来保存到集中结构化的数据库中便于后续的营销分析与利用。<br>
<br>
我们提供Web2DB网络<a href="http://www.knowlesys.cn/cn/services.htm" target="_blank">信息采集服务</a>，
你只需要告诉我们你的目标网页以及你的数据需求，其它的工作全由我们来做，很快你就可以直接得到你需要的数据了。数据库的格式可以为Excel,
CSV, Access, MSSQL, 以及MySQL. <br>
<br>
我们提供产品化的<a href="http://www.knowlesys.cn/" target="_blank">乐思</a>网络信息采集系统软件，你可以在任何时间自行配置采集任何网站的任何内容。 <br>
<br>
<strong>有何利益?<br>
</strong> 你将在潜在用户信息收集整合方面节约大量的人力与资金。<br>
广泛应用于行业门户网站，竞争情报系统，知识管理系统，网站内容系统，<a href="http://www.knowlesys.cn/intergration-marketing.htm" target="_blank">整合营销</a>等领域。]]></description>
</item><item>
<title><![CDATA[实例教你30种绕过前台的技巧]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=41403</link>
<author>Webextraction</author>
<pubDate>2008/11/27 15:03:52</pubDate>
<description><![CDATA[<div id="blog_text" class="cnt"><div class="Post1">
<div class="Post1">
<p>在销售中，最难、最关键的就是找到大量潜在客户资料了。原来都是需要我们在网上四处搜集，现在网络技术飞速发展，这一步我们可以轻松跨过去了，比如用<a href="http://www.knowlesys.cn/" target="_blank">乐思</a><a href="http://www.knowlesys.cn/cn/services.htm" target="_blank">客户信息采集</a>，一个小时就可以从网络中整理出上万的资料。但是接着的问题有来了，我们要找到对方老板或者负责人，就需要绕过前台，这里面有很大的技巧，为了方便我们后来的同行们迅速成交，我特把自己的多年经验归纳总结为以下30点。</p>
<p>1.在找资料的时候，顺便找到老板的名字，在打电话的时候，直接找老总，若对方问到我是谁，我会说是其客户或者朋友，这样找到的机会大一些；（装老板朋友 /客户（与外有业务联系的部门是比较好转的，如：人事招聘，销售，市场，广告，采购。）</p>
<p>2.多准备几个该公司的电话，用不同的号码去打，不同的人接，会有不同的反应，这样成功的几率也比较大。</p>
<p>3.随便转一个分机再问（不按0转人工），可能转到业务员那里或人事部，这样就躲过前台啦，然后就看如何与非前台人员如何沟通了，没准一下转到老总那里， 呵呵！</p>
<p>4.直接告诉前台建网站有好处，或者做推广的必要性，让她无法拒绝！</p>
<p>5.如果你觉得这个客户很有戏，你就不要放弃，可以找另外一个同事帮你打，顺便考考你的同事，也可以学到新的方法！</p>
<p>6、事态严重化（使无权处理）例如：（对于房产公司）你好，我有一栋楼要出租，希望找你们公司老总谈，不知道你们老板贵姓？再如：（对于广告公司）你好， 我是北京晚报的，您们公司老总是那一位？我们跟他谈谈代理的事情！</p>
<p>7.你好我是51job的，贵公司在我们这里登记招聘员工的信息，我想问一下贵公司的法人是谁？因为我们要核对您的相关资信情况！</p>
<p>8.夸大身份！例如：你好，转你们李总（声音要大）！我是××公司的王总啊！</p>
<p>9. 我是用了历史上最卑鄙无耻的两种方法。 假设知道老总姓李 A：你好这是++公司 B：你好李**叔叔在么？我是他的侄子！
嘟嘟--转过去了 设不知道老总姓什么 A：你好这是**公司
B：你好**公司吧，你们在**大厦上么？我是电力公司的，你们这个月的电费有点问题，给我转到行政部嘟嘟---转过去了
对付她们很容易的，只要你有征服他们的欲望，就有办法！</p>
<p>10.威胁法！ 1）例如：小姐，这事情很重要，你能否做主？我很急，马上帮我转给你们公司老总（或负责人） 备注：此类方法适用于买域名！</p>
<p>11.A:喂...李总在吗? B:不在,你哪里 A:我泉州的,我姓章,他电话（手机）是多少? 声音放低点,一般情况前台都会告诉你老板手机的</p>
<p>12.前台：你哪里？ 回答：厦门的，刚来福州，有重要事情找你们老总（知道姓名，那就直说姓名） 前台：我问你哪里，哪个公司的？！ 回答：小姐，你姓什么？我很不习惯你这样问话知道吗？！（语气要强，拍着桌子说话）在不在，在就给我转进去，不在就把手机拿过来！</p>
<p>13.A:小姐，张总可能有急事找我，他打了我的手机，现在还在公司吗？我回电！谢谢！</p>
<p>14. 大家好，我是厦门商务部的新员工，黄添荣，希望能和你有很好的交流，对于绕前台，我自认为这种办法有时还是挺管用。
针对外地的，官方式：你好，我是（厦门），受国家有关部门委托，找贵司总经理！ 本地的：我：“你好，转总经理” 小姐：“你有什么事？” 我：“有”
小姐：“你是哪个单位的？” 我：“我是黄添荣。” 评论：小姐听到我们的名字一定会以为我们和总经理很熟，这个办法真的很不错的，试试！</p>
<p>15.1)惠州这边很多的土老板,我就会直接说:老板在吗?他电话多少? 2）有时在知道老板的姓以后我会讲:王老板在吗? 若不在就说:他过我公司来了没有呀?怎么还没来?手机多少?</p>
<p>16. “我是**路邮局的，请问你们公司的全称是*******，总经理是***，我现在找他核对一下......。 一般广州这边这种方法比较有效，还有假装政府机关或银行等</p>
<p>17.我是厦门分公司的周统彬，针对平常方法绕不过的前台时，索性坦白相当，尊重她：王小姐，你早！我是中国企业网的周统彬，我昨天已与李总联系过了，不 知你是否可以替我安排今天上午或者下午，与李总通个电话，只需2分钟，谢谢！</p>
<p>18.我通常是用国际采购商的身份找相关负责人或老板。有时我会留下另一个手机给她们让他们叫老板来找我！</p>
<p>19.你好，我是国家互联网信息中心XX处办事处的，叫你们老总接电话！</p>
<p>20. 在武汉，很多人好管闲事，非要问清楚，其实问不问结果都一样，所以她越想知道我越拽，通常说， ——*总在不在啊？——你是哪位啊？
——我是他一个朋友。——找他有什么事？ ——有点私事，他是不是不在啊？这时她就给老总了。或者她会说， ——他不在。
——那你告诉我他的手机，我把他号码弄丢了，谢谢，有点急事。</p>
<p>21.如果是要找老板,我一般会说是外商的翻译员,然后就拿老板的姓名和手机,这个方法还是挺管用的.各位不防可试试的.例如：你好，有一家德国的××公 司，看到你们公司的英文网页（供求信息）想和你们公司老总通个电话，你们老板的手机是多少？他在吗？……</p>
<p>22.“您好！ XX公司吗？我们是市政府经济贸易委员会的，我们有一个重要的经济论坛活动要邀请贵公司负责人，麻烦您把电话转给他，我们要就具体的事宜跟他确认。” 因为上个月我们广州公司刚好有这样一个大型活动，我通过这种电话得到不少老总的姓名和电话。</p>
<p>23.知道该公司老总名字（男性）后，请一男士拿起电话：我找***（直呼其名）。。。。。。不在？他手机号码是多少？。。。。。。我是谁？昨天还一起喝 酒了的！（很拽的语气）</p>
<p>24.你们总经理姓什么我忘记了，对了，上次他对我说：过段时间再打给他。所以我今天就打给他了，你帮我转到总经理办公室好吗？谢谢你！</p>
<p>25.请找×总，怎么不在？不是说好今天这个时候让我去个电话吗？你看他什么时候回来？这事挺重要，他的手机是138还是139？你告诉我，我记一下。</p>
<p>26.
您好！我是沈阳分公司的庞玉。我一般就是告诉前台的小姐说：“我知道你很为难，每天接到各种各样的电话都很多，很难确定那个电话该去找老板，我也有
过这样的经历，我很理解您。同时我也告诉您，我给你们老板打电话是有一个对贵公司很重要的事情。必须马上和你们老总取得联系，麻烦你现在帮我找一下。</p>
<p>27.自称自己是某银行的需要和X总核对资料，或者是存款出了些问题，要通知X总。 （前台一般不敢过问老总的钱的事情。）</p>
<p>28.你好,我是某某记者.(我本身有记者证)想和你们老总商量一些事情！</p>
<p>29.“您好！帮我接一下你老总！我昨天有一份传真给他，确认一下他是否收到了”</p>
<p>30.假如你英语好的话，给前台几句纯正的英语，立马搞定，百试不爽</p>
</div>
</div></div>]]></description>
</item><item>
<title><![CDATA[2008年信息安全服务市场发展报告]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40777</link>
<author>Webextraction</author>
<pubDate>2008/10/23 16:20:03</pubDate>
<description><![CDATA[<a>　与近年来的IT服务外包模式的快速发展类似，IT安全服务市场也呈现快速发展的趋势，企业客户在决策和实施IT安全解决方案之前，越来越倾向于向专业的
IT安全公司咨询，或在实施过程中聘请专业安全人员担任实施顾问和员工培训，或直接聘请专业安全人员对企业安全漏洞进行弱点测试。依据Gartner提供
的数据，安全服务市场占据了2006年全球安全市场的57%，并且随着IT安全基础投资的成熟，这一比例在未来5年内还将持续走高。<br>

<br>
&nbsp;</a><div id="articleBody" class="articleContent"><wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
如图1 IDC 预测的2007-2011中国安全服务市场的规模和增长率示意图。
<p style="text-align: center;"><img alt="" src="http://oa.cnic.cn/uploadfiles/20080715/clip_image002%282%29.jpg" width="554" height="388"><br>
<br>
&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
图1 中国安全服务市场的规模和增长率</p>
<br>
<br>
&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>预计在2008年，企业用户对安全咨询、安全实施顾问以及安全开发集成人员的需求将持续增长。随着安全威胁的升级和安全解决方案的提升，专业安全人员要不断提升自己的专业技能以适应新的安全环境。<br>

<br>
&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
根据IDC的预测，到2009年，中国IT安全服务市场的年复合增长率达30.7%，相对于同期安全产品市场28.3%的年复合增长率，这个数字有着更大
的诱惑力，但与国外成熟的IT 和IT 安全服务市场相比，中国的IT 安全服务市场仍然有着较大的发展空间。<br>
<br>
&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
&nbsp;<wbr> &nbsp;<wbr> &nbsp;<wbr>
&nbsp;<wbr> &nbsp;<wbr> 需要更多信息安全资料，可以<a style="font-weight: bold;" href="http://www.knowlesys.cn/">乐思采集</a>进行搜集整理；实例操作： <a href="http://knowlesys.cn/cn/tutorial/examples/" target="_blank">使用演示</a></div>]]></description>
</item><item>
<title><![CDATA[网络搜索排名有玄机]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40776</link>
<author>Webextraction</author>
<pubDate>2008/10/23 16:14:54</pubDate>
<description><![CDATA[<a>&nbsp; <br></a><div id="articleBody" class="articleContent">&nbsp;&nbsp;&nbsp; 本想通过网上购物给朋友购买防辐射的布料，没有想到竟遭遇了购物陷阱，差点上了假网站的当。记者日前亲身经历了这样的尴尬。<br>
<br>
　　在搜索“某某防辐射服”之后，出现了无数的网站。记者打开前两个网站后，看到的是两个网络购物的网站，还有即时对话的小窗口。记者随机询问他们是否有
该品牌防辐射服的布料，回答是确定的。那怎么能确定你们的真假呢?面对记者的询问，该网站的工作人员表示：“一般的防辐射服经销商只是销售衣服，从不销售
这种防辐射的布料，我们是厂家指定的网络销售渠道。”而且他还表示，该品牌防辐射服装北京没有分销点，只有通过网站才能买到。<br>

<br>
　　听到这个有点牵强的理由，再看着这一个貌似官方网站的销售网站，不免有些让人起疑。在拨通了上海114查号台之后，记者终于找到了该品牌防辐射服公司
的电话。该公司销售部门的工作人员告诉记者，现在外面假冒该公司的网站有好几个，做得都跟官方网站一样，网站地址也是使用比较类似的拼音缩写。“我们真正
的官网后缀名是COM，而不是CN或者NET之类，请消费者不要相信一些网络购物的网站。”这位工作人员提供了总部的电话，告诉记者可以通过电话查询一下
北京的经销商，另外也可以通过官方网站查询一下北京的经销商地址。<br>

<br>
　　为什么官方网站不是排在第一个搜索选项?这个问题让人困惑。某公司的市场部人员直言不讳地告诉记者，搜索排名是跟钱直接挂钩的，“我们接到不少搜索公司的电话，如果我们想把排名靠前的话，需要多交不少钱。”<br>

<br>
　　某家专门销售活性炭的科技公司经理告诉记者，通过缴费，他们公司获得了某关键字搜索的第一结果选项，这给公司带来比较可观的效益。“因为消费者一般都认为排名靠前的公司值得信任。”该经理表示。<br>

<br>
　　的确，现在越来越多的搜索结果并不是把一些公司的官方网站放在前位，这让不少消费者无所适从。“一些网站会趁机钻这个空子，把自己公司的网址注册得跟
官方网站非常接近，既不违反法律，也开展一些类似的业务。这使得很多消费者误以为是正规的大公司网站。我们接到过这样的一些投诉，在此也提醒消费者，如果
一时间无法分辨，最好还是拨打114查号台去咨询一下公司电话，问问真假。”中国质量万里行促进会负责投诉服务的一名工作人员告诉了这样一个小窍门。<br>

<p><font face="Verdana"><br></font></p>
<br>
<br>
&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
避免商业搜索误导，最好的方法是自己搜集资料，建立自己的数据库，可以使用<a style="font-weight: bold;" href="http://www.knowlesys.cn/">乐思采集</a> ，用垂直搜索的方式，自动的来搜集整理。实例操作：
<a href="http://knowlesys.cn/cn/tutorial/examples/" target="_blank">使用演示</a></div>]]></description>
</item><item>
<title><![CDATA[亚洲200佳 中国88家企业居首]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40775</link>
<author>Webextraction</author>
<pubDate>2008/10/23 16:00:44</pubDate>
<description><![CDATA[<a>　据香港文汇报报道，《福布斯》公布本年度营业额10亿美元以下的200家最佳亚洲企业名单，当中两岸三地企业占了88家，居各国之首。<br>

<br>
分析指北京举办奥运，对运动公司如李宁、鸿星尔克集团，以及旅游业的业绩都有正面帮助。<br>
<br>
受过去一年的金融危机影响，不少企业股价对比去年大幅倒退，令不少股东身家大减。例如理文造纸的李氏家族，其所持股份价值就由去年的30亿美元，跌至5.88亿美元。然而，虽然榜上企业的股价平均比去年下跌了32%，但仍然比FTSE亚洲指数的表现为佳。<br>

<br>
名单选自过去一年营业额在10亿美元以下的上市企业，按其过去3年的营业额和盈利增长选出。两岸三地上榜企业包括市值最高的阿里巴巴、盈利最高的合景泰富地产。<br>

<br>
其它企业包括国内旅游网站携程旅行网(Ctrip.com)、味千拉面、中国龙工控股等，台湾亦有多家科技企业上榜。<br>
<br>
《福布斯》指出，今年上榜的企业大多具备抗逆能力，因此在经济前景仍未明朗下，200大企业名单将有助投资者挑选有实力的企业。<br>
<br>
<br>
<br></a><p><a>
搜集更多相关经济数据资料，高效利用网络信息资源，可以参考</a><a style="font-weight: bold;" href="http://www.knowlesys.cn/">乐思采集</a>；实例操作： 
 <a href="http://knowlesys.cn/cn/tutorial/examples/" target="_blank">使用演示</a></p><p></p>]]></description>
</item><item>
<title><![CDATA[Windows Server 2008 的虚拟技术]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40774</link>
<author>Webextraction</author>
<pubDate>2008/10/23 15:51:06</pubDate>
<description><![CDATA[<br><strong><img src="http://blogimg.chinaunix.net/blog/upfile2/080512201728.jpg" onload="javascript:if(this.width>500)this.width=500;" border="0"></strong><div style="text-align: left;">
</div><p style="text-align: left;"><strong>&nbsp;</strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="font-family: 宋体;">虚拟化技术是一种调配计算资源的方法，它将不同层面</span><span style="font-family: Arial;" lang="EN-US">——</span><span style="font-family: 宋体;">硬件、软件、数据、网络、</span><span style="font-family: Arial;" lang="EN-US"><a href="http://www.storworld.com/" target="_blank"><span style="color: windowtext; font-family: 宋体;" lang="EN-US"><span lang="EN-US">存储</span></span></a>——</span><span style="font-family: 宋体;">隔离开来。</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008</span><span style="font-family: 宋体;">包含了</span><span style="font-family: Arial;" lang="EN-US">“<a title="服务器" href="http://product.it168.com/files/0402search.shtml" target="_blank"><span style="color: black; font-family: 宋体;" lang="EN-US"><span lang="EN-US">服务器</span></span></a></span><span style="font-family: 宋体;">虚拟化</span><span style="font-family: Arial;" lang="EN-US">”</span><span style="font-family: 宋体;">角色，它采用了非常广阔的视角，不只局限于服务器的虚拟化，涵盖到计算机的虚拟还有应用的虚拟。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="font-family: 宋体;">现在很多人对于</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008</span><span style="font-family: 宋体;">虚拟化技术的应用前景表示关注，各种规模不同的公司都已经认识到虚拟化开始作为了一个改变当前场景的因素。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="font-family: 宋体;">虚拟化的优势在于，它的运行完全像一台物理服务器一样，而终端用户根本感觉不到差异。另外，在同一台物理服务器上运行多台虚拟机（最多可达到</span><span style="font-family: Arial;" lang="EN-US">15</span><span style="font-family: 宋体;">至</span><span style="font-family: Arial;" lang="EN-US">20</span><span style="font-family: 宋体;">台），可以节省硬件、数据中心的空间以及能耗。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="font-family: 宋体;">既然说到虚拟化，不得不提的是</span><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">。</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008</span><span style="font-family: 宋体;">的“</span><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">”新功能把服务器虚拟技术融入操作系统。这样提高了虚拟化技术的效率，提供更好的性能。</span><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">技术以支持服务器整合，支持在新硬件上运行旧操作系统和应用程序，以及跨平台可迁移应用程序的灾难恢复。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-align: left;"><span style="font-family: Arial;" lang="EN-US"><o:p><strong><font size="3">&nbsp;</font></strong></o:p></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-align: left;"><span><strong><font size="3">Hyper-V的组建：<o:p></o:p></font></strong></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">管理程序</span><span style="font-family: Arial;" lang="EN-US">(hypervisor)</span><span style="font-family: 宋体;">：用来创建不同的分区，而代码的每一个虚拟化实例会在这些分区上运行；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">虚拟化堆栈以及新的虚拟化</span><span style="font-family: Arial;" lang="EN-US">I/O</span><span style="font-family: 宋体;">模型：提供了和</span><span style="font-family: Arial;" lang="EN-US">Windows</span><span style="font-family: 宋体;">自身的交互功能以及和被创建的不同分区的交互功能；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">管理程序</span><span style="font-family: Arial;" lang="EN-US">(hypervisor)</span><span style="font-family: 宋体;">、虚拟化堆栈以及新的虚拟化</span><span style="font-family: Arial;" lang="EN-US">I/O</span><span style="font-family: 宋体;">模型，</span><span style="font-family: 宋体;">三个组件是顺序工作的；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">使用的服务器需要装备</span><span style="font-family: Arial;" lang="EN-US">Intel VT-</span><span style="font-family: 宋体;">或</span><span style="font-family: Arial;" lang="EN-US">AMD-V-enabled</span><span style="font-family: 宋体;">的处理器，</span><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">可以与管理程序交互，管理程序是一个在处理器上非常小的软件；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">的优势是：可以减少机器的副本以及节省成本；可以对多个客户集群的支持；可以在虚拟化服务的主机上“热插拔”各种资源；可以将多个运行着</span><span style="font-family: Arial;" lang="EN-US">Hyper-V</span><span style="font-family: 宋体;">组件的物理机做成集群等；</span></font><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="color: black; font-family: 宋体;">如果提到虚拟机，相信大家一定会想到</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">VMware</font></span><span style="color: black; font-family: 宋体;">和</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">Virtual PC</font></span><span style="color: black; font-family: 宋体;">这两个虚拟机软件。微软收购了</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">Virtual PC</font></span><span style="color: black; font-family: 宋体;">这个软件的开发公司后，就将</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">Virtual PC</font></span><span style="color: black; font-family: 宋体;">整合到了新的服务器操作系统里面。并且在改进后以</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">Windows Server virtualization </font></span><span style="color: black; font-family: 宋体;">（</span><span style="color: black;" lang="EN-US"><font face="Times New Roman">WSV</font></span><span style="color: black; font-family: 宋体;">）的完整化平台形式出现在大家面前。</span><span style="color: black;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><span style="font-family: Arial;" lang="EN-US"><o:p><strong><font size="3">&nbsp;</font></strong></o:p></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-align: left;"><span><strong><font size="3">虚拟化服务器WSV（Windows Server Virtualization）：<o:p></o:p></font></strong></span></p><div style="text-align: left;">
</div><p style="text-align: left;"><span style="font-size: 10.5pt; font-family: Arial;" lang="EN-US"><strong>WSV</strong></span><span style="font-size: 10.5pt; font-family: 宋体;"><strong>引入了与虚拟机存储硬件相关的新的特点，支持访客操</strong></span></p><div style="text-align: left;">
</div><strong>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <img src="http://blogimg.chinaunix.net/blog/upfile2/080512201826.jpg" onload="javascript:if(this.width>500)this.width=500;" border="0"></strong><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">作系统接入存储器。虚拟机的磁盘通过路径（</span><span style="font-family: Arial;" lang="EN-US">Pass-Through Disk Access</span><span style="font-family: 宋体;">）允许虚拟机直接进入可写文件系统而无须使用</span><span style="font-family: Arial;" lang="EN-US">VHD</span><span style="font-family: 宋体;">文件。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">使用磁盘通过路径使原先以</span><span style="font-family: Arial;" lang="EN-US">VHD</span><span style="font-family: 宋体;">形式压缩数据可以由非虚拟系统在文件系统中进行操作。这种存储配置中的额外选择增加了</span><span style="font-family: Arial;" lang="EN-US">WSV</span><span style="font-family: 宋体;">使用</span><span style="font-family: Arial;" lang="EN-US">scenarios</span><span style="font-family: 宋体;">的灵活性。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">用于</span><span style="font-family: Arial;" lang="EN-US">WSV</span><span style="font-family: 宋体;">中的</span><span style="font-family: Arial;" lang="EN-US">VMBus</span><span style="font-family: 宋体;">建筑为虚拟机提供合成存储装置控制器。合成存储装置控制器支持每台控制其多达</span><span style="font-family: Arial;" lang="EN-US">255VHDs</span><span style="font-family: 宋体;">，还支持每台虚拟机的控制器不限数量。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">指定虚拟机所使用的虚拟内核，最多可以使用八个内核；</span><span style="font-family: Arial;" lang="EN-US"> <o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">支持内存的</span><span style="font-family: Arial;" lang="EN-US">Copy on Write</span><span style="font-family: 宋体;">功能，可以极大地节省内存；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">可以创建</span><span style="font-family: Arial;" lang="EN-US">X64</span><span style="font-family: 宋体;">位的虚机；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">支持</span><span style="font-family: Arial;" lang="EN-US">Linux</span><span style="font-family: 宋体;">，可以很好地运行</span><span style="font-family: Arial;" lang="EN-US">SUSE Linux</span><span style="font-family: 宋体;">；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">可以实现</span><span style="font-family: Arial;" lang="EN-US">P2V(</span><span style="font-family: 宋体;">物理机到虚拟机</span><span style="font-family: Arial;" lang="EN-US">)</span><span style="font-family: 宋体;">的迁移；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-align: left;"><span><strong>WSV<font size="3">的CPU硬件要求：<o:p></o:p></font></strong></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">支持硬件虚拟化，例如</span><span style="font-family: Arial;" lang="EN-US">Intel VT</span><span style="font-family: 宋体;">或者</span><span style="font-family: Arial;" lang="EN-US">AMD T</span><span style="font-family: 宋体;">；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">支持</span><span style="font-family: Arial;" lang="EN-US">X64</span><span style="font-family: 宋体;">位技术；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">支持硬件</span><span style="font-family: Arial;" lang="EN-US">DEP</span><span style="font-family: 宋体;">技术；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><strong><font size="3"><span style="font-family: 宋体;">结合虚拟技术和可以免费下载的</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008 beta 3</span><span style="font-family: 宋体;">，可以非常容易的搭建一个测试环境。</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-indent: 1cm; text-align: left;"><span style="font-family: Arial;" lang="EN-US"><o:p><strong><font size="3">&nbsp;</font></strong></o:p></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt; text-align: left;"><span><strong><font size="3">安装X64位的Windows Server 2008 RC0 Enterprise基本步骤：<o:p></o:p></font></strong></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><strong><font size="3"><span style="font-family: 宋体;">进入安装目录，定</span><span style="font-family: 宋体;">位</span></font><span style="font-size: 9pt; color: rgb(44, 44, 44); font-family: Arial;" lang="EN-US">WSV</span><font size="3"><span style="font-family: 宋体;">子目录，分别运行</span><span style="font-family: Arial;" lang="EN-US">Windows6.0-KB939853-x64.msu</span><span style="font-family: 宋体;">和</span><span style="font-family: Arial;" lang="EN-US">Windows6.0-KB939854-x64</span><span style="font-family: 宋体;">；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><span style="font-family: 宋体;"><strong><font size="3">需要把</font></strong></span><span style="font-size: 9pt; color: rgb(44, 44, 44); font-family: Arial;" lang="EN-US"><strong>WSV</strong></span><strong><font size="3"><span style="font-family: 宋体;">虚拟化作为一个角色添加到</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008</span><span style="font-family: 宋体;">系统中：</span><span style="font-family: Arial;" lang="EN-US">Server Manager</span><span style="font-family: 宋体;">中，选中</span><span style="font-family: Arial;" lang="EN-US">Roles</span><span style="font-family: 宋体;">，单击详细窗体里的</span><span style="font-family: Arial;" lang="EN-US">Add Roles</span><span style="font-family: 宋体;">，选中</span><span style="font-family: Arial;" lang="EN-US">“Windows Server Virtualization”</span><span style="font-family: 宋体;">；</span><span style="font-family: Arial;" lang="EN-US"><o:p></o:p></span></font></strong></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: Wingdings;" lang="EN-US"><span style=""><strong><font size="3">l</font><span style="font-family: 'Times New Roman'; font-style: normal; font-variant: normal; font-weight: normal; font-size: 7pt; line-height: normal; font-size-adjust: none; font-stretch: normal;">&nbsp;&nbsp;&nbsp; </span></strong></span></span><span style="font-family: 宋体;"><strong><font size="3">设置一些必要的配置信息，例：配置虚拟网络等，系统提示重启；</font></strong></span></p><div style="text-align: left;">
</div><p class="MsoNormal" style="margin: 0cm 0cm 0pt 49.35pt; text-indent: -21pt; text-align: left;"><span style="font-family: 宋体;"></span><span style="font-family: Arial;" lang="EN-US"><o:p><strong>&nbsp;</strong></o:p></span></p><div style="text-align: left;">
</div><strong><img src="http://blogimg.chinaunix.net/blog/upfile2/080512201920.jpg" onload="javascript:if(this.width>500)this.width=500;" border="0"></strong><div style="text-align: left;">
</div><p style="text-align: left;"><strong>&nbsp;</strong></p><div style="text-align: left;">
<strong><font size="3"><span style="font-family: 宋体;">虽然说虚拟化服务器是一个未完成的产品，虽然它会缺少如热迁移这样的一些功能，现在它还是以拼凑的方式，采用最新的虚拟化方法</span><span style="font-family: Arial;" lang="EN-US">——</span><span style="font-family: 宋体;">系统管理程序技术，但是</span><span style="font-family: 宋体;">服务器巩固、能耗效率、增强的功能以及更加简单的管理和部署，对于转向虚拟化服务器以及虚拟的主服务方面都有着切实的好处。</span><span style="font-family: 宋体;">随着</span><span style="font-family: Arial;" lang="EN-US">Windows Server 2008</span><span style="font-family: 宋体;">的推出以及成熟的</span><span style="font-family: Arial;" lang="EN-US">64</span><span style="font-family: 宋体;">位多核服务器，</span><span style="font-family: Arial;" lang="EN-US">IT</span><span style="font-family: 宋体;">行业也将登上全新数据中心模式的巅峰。</span></font></strong></div>]]></description>
</item><item>
<title><![CDATA[信息化——新型陆军会的发展方向]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40381</link>
<author>Webextraction</author>
<pubDate>2008/9/29 16:09:44</pubDate>
<description><![CDATA[
<P>近年来，美军提出了“21世纪陆军发展构想”，并着手组建“21世纪新型陆军”。其实质就是充分利用现代尖端科技，建设一支信息传输数字化、指挥控制系统实时化、武器装备智能化的新型陆军部队，使战场上各种作战要素联结成一个有机整体，提高部队的整体作战能力。在美国陆军提出数字化设想后，西欧各主要军事强国纷纷效仿，相继提出了建设数字化军队的计划。由此可见，数字化已成为世界陆军建设以至整个军队建设发展的重要趋势。</P>
<P>一、 陆军现代化已由机械化向信息化转变<BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 以往的陆军现代化主要以机械化为标志。随着以电子信息技术为主体的高技术装备的发展，而且整个社会正由工业化时代向信息化时代迈进，建立在工业化基础上的机械化军队也正在向信息化军队演变。如果说机械化军队建设主要是以“硬件”的发展为主提高战斗力，那么数字化建设就主要是以“软件”的发展来提高军队的战斗力。在信息化中，机械化装备只是信息化武器装备的载体，其战术技术性能的提高主要是依赖于信息化系统。美军建立数字化部队的大件兵器——M1A2主战坦克、M2步兵战车、AH－64攻击直升机、爱国者导弹等等，都是因为采用了数字化通信、火控系统才具有新的技战术性能，并在战场上发挥出了巨大的威力。由信息化装备水平决定未来战争的作战方式，这是陆军建设上的一个质的飞跃，也是一个必然的趋势。对此，我们的建军思想要摒弃过时的现代化观念，改变传统的、工业化标准的以人力、物力密集型和机械化功率指标为基础的现代化。应该以现代电子信息等高技术为基础的技术密集为标志的现代化。只有如此，才能建设起一支高技术陆军。 <BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 二、 信息的获取和利用能力已成为战斗力的主要因素 <BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 陆军信息化的实质在于重点利用当今电子信息技术的最新成果，改进部队战场<A href="http://www.knowlesys.cn/cn/products.htm">信息的获取</A>和控制使用能力。在机械化战争中，军队武器装备的机动力、射程、杀伤破坏威力是战争技术层面的重要衡量指标，如今的武器装备以再这几个方面发展到了极致，如果要突破，只能是在其他方面。反之，现代各国军队在战场<A href="http://www.knowlesys.cn/">信息获取</A>和控制利用方面都还有巨大的潜力和不足。就是美军在这方面的控制能力都尚居于探索中，遑论他国。许多实战表明，部队士兵与士兵之间，班、排、连、营、团、师、军、兵团各级之间、以及各兵种专业分队间的联系，特别是对敌方情况的了解掌握，都没有达到理想的实时化、准确化的程度，因此使军队现有的机械化战争能力不能得到充分的发挥，充其量能将其最高效能发挥到30％――50％。由此可见，提高信息的获取和控制使用能力已成为提高军队战斗力的关键所在，必须以信息化为重点加强陆军兵种建设的水平。从我军目前情况看，主要还是优先发展指挥通信合成控制系统和武器装备的火控系统以及电子对抗系统这三大系统的技术水平。 <BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 三、 信息化建设离不开机械化的基础 <BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 信息化建设是以机械化为基础的。所有信息化系统只有在机械化的基础上才能使用并发挥最大效能。举个简单的例子：再先进的夜视观察器材只能与坦克、装甲车、飞机结合，而不是与大刀结合。目前的陆军发展，必须一方面继续深化发展武器装备的机械化水平；另一方面要是这种发展与信息化建设紧密结合，就是说要按照<A href="http://www.knowlesys.cn/cn/custom-extractor.htm">信息化建设</A>的要求来发展机械化，实现两者的有机统一。而其基本途径是加强武器装备的一体化和通用化。所谓一体化，就是要是机械化装备与信息化装备融为一体，主要内容就是将电子信息和计算机应用技术融入到主要武器装备中去，化技术功能为作战效能，提高自动化、信息化和智能化水平。所谓通用化，是指要使各兵种的武器装备（包括机械化和信息化装备）要成套、成族，实现标准化、系列化，以便互通互用，从而使兵种武器装备的技战术水平和后勤保障能力得到突破和提高。 <BR>&nbsp;&nbsp;&nbsp; <BR>&nbsp;&nbsp;&nbsp; 由上述可知，我国未来陆军的基本特点会是：在机械化的基础上实现信息化，并由信息化与机械化相结合，从而产生新的作战思想和形式。 </P>
<P>&nbsp;</P>]]></description>
</item><item>
<title><![CDATA[网络信息采集——政务信息采集的最有效途径]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40368</link>
<author>Webextraction</author>
<pubDate>2008/9/28 14:57:27</pubDate>
<description><![CDATA[<div class="post-body"><p align="left"><strong>政务信息采集</strong>是政府工作中非常重要的一项事务，并且，随着现在信息量日益丰富和传播速度加快，<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">信息采集</span></span></a></span>工作的重要性越发突出。要高质量的采集到有效信息，畅通的渠道又是其中的关键。</p><p align="left">一般情况下，主要通过这么几条渠道来<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_news_miner.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">采集信息</span></span></a></span>：</p><p align="left"><span xml:lang="EN-US" lang="EN-US">1</span>、内网信息渠道。网络信息具有含  量大、传递速度快、内部性强的特点。</p><p align="left"><span xml:lang="EN-US" lang="EN-US">2</span>、会议信息渠道。也就是通过参加会议或收集有关会议材料，采集有价值的信息。</p><p align="left"><span xml:lang="EN-US" lang="EN-US">3</span>、新闻信息渠道。通过媒体收集信  息是一种补充的收集方法，但也要弄清新闻编写与信息编写的区别：它们的区别主要在于特性和要求不同。</p><p align="left"><span xml:lang="EN-US" lang="EN-US">4</span>、<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/net-info-resource.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">互联网信息渠道</span></span></a></span>。互联网络沟通了与各方面的联系，具有信息覆盖面广、信息反应快、信息量巨大等特点，已成为信息采集的新渠道和信息的新来源。</p><p align="left"><span xml:lang="EN-US" lang="EN-US">5</span>、公文信息渠道。从公文材料中挖掘信息。<span xml:lang="EN-US" lang="EN-US">&nbsp;</span></p><p align="left"><span xml:lang="EN-US" lang="EN-US">6</span>、自采信息渠道。自采的方法，主要分个别访问、座谈调查、现场观察、问卷调查、亲身体验等。</p><p align="left">从以上<span xml:lang="EN-US" lang="EN-US">6</span>中最常用的采集方法上来看，内网信息渠道、新闻信息渠道、互联网信息渠道、公文信息渠道等<span xml:lang="EN-US" lang="EN-US">4</span>种都可以和网络、电脑有着密切关系，由此也可以证明了现在的信息传播中网络的巨大的，并不断加强的作用。</p><p align="left">采集政务信息时，如果能够抓住网络这条主线，那么采集任务也是基本是成功的。但是，网络资源而此浩大，我们如何才能精准，快速的采集呢？用手工是肯定无法完成的，费时没效率。我们可以把目光投向软件，以<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">乐思信息采集系统</span></span></a></span>为代表来分析，<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">采集软件</span></span></a></span>可以：</p><p align="left"><span xml:lang="EN-US" lang="EN-US">1</span>、实时跟踪、采集与政府工作相关的国内外及地方新闻，政策法规，经济，产业等信息</p><p align="left"><span xml:lang="EN-US" lang="EN-US">2</span>、自动的完成社会自由交流平台的各类信息采集和整理，如论坛、<span xml:lang="EN-US" lang="EN-US">blog</span>、即时聊天工具等信息</p><p align="left"><span xml:lang="EN-US" lang="EN-US">3</span>、政府主网站对各地级子网站的信息采集与整合</p><p align="left"><span xml:lang="EN-US" lang="EN-US">4</span>、支持本地文本文件抽取</p><p align="left"><span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/information-software.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">网络采集软件</span></span></a></span>快速的获取的大量信息，无论是时效、量，还是准确度、覆盖面都是原来传统方式的跨越式升级，网络信息采集，是当之无愧的<strong><span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/info-manage-and-extract-software.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">政务信息采集</span></span></a></span></strong><strong>最有效途径</strong>。政府在拥有这些全面的准确的信息后，就能够做出更加准确、更加实用的决策！</p><p align="left"><span xml:lang="EN-US" lang="EN-US">&nbsp;</span></p><p>相关抓取演示：<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">实例演示</span></span></a></span></p><p><span xml:lang="EN-US" lang="EN-US">&nbsp;</span></p><p>自动抓取软件：<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_news_miner.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">新闻采集高手</span></span></a></span>、<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_forum_miner.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">论坛</span></span><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">采集高手</span></span></a></span>、<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_text_miner.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">文本</span></span><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">采集高手</span></span></a></span>、<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_data_fetcher.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">信息采集开发包</span></span></a></span>、<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/data-service.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">数据抽取服务</span></span></a></span></p><p>详细资料：<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">乐思软件</span></span></a></span>（<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.com/">knowlesys</a></span>）</p></div>]]></description>
</item><item>
<title><![CDATA[新闻采集程序——让千万记者为你写稿]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40367</link>
<author>Webextraction</author>
<pubDate>2008/9/28 14:53:47</pubDate>
<description><![CDATA[<div class="post-body"><p>互
联网让整个世界产生了一次重大的革新，特别的针对对信息敏感度极高的新闻行业来说，更是天翻地覆，网络的无时差，无地域限制，使得新闻行业的门槛低了许
多，原来只有大型机构，才能有实力、有经验来做新闻，现在则不一样了，只要找到了合适的方法，中小型的、地方型的机构都可以加入进来，并且可以做得很出
色！</p><p>下面我就来介绍最为关键之处：新闻来源问题。新闻质量的好坏是决定成败的主要因素。</p><p>让千万记者为你免费写稿，这是无数媒体编辑梦寐以求的，但是这一直停留在梦想中，现在，通过<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">网络<span xml:lang="EN-US" lang="EN-US">采集技术</span></span></span></a></span>的前进，这个已经可以成真了，特别是<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">乐思</span></span></a></span>的专门为新闻采集研发的<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/new-extraction-program.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">新闻采集<span xml:lang="EN-US" lang="EN-US">程序</span></span></span></a></span>，更是能够出色的完成这一任务。它可以：</p><p><span xml:lang="EN-US" lang="EN-US">&nbsp;</span></p><p>每天<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/auto-extract.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">自动采集</span></span></a></span>指定网站的新闻内容，扩大内容来源与数量</p><p>轻松<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/intergration-marketing.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">整合</span></span></a></span>不同地区与行业的新闻，形成专题</p><p>实时跟踪、采集与某行业相关的国内外及地方新闻，政策法规，经济信息</p><p>另外还可以解决与因特网隔离的重要部门对于因特网的信息需求问题</p><p><span xml:lang="EN-US" lang="EN-US">&nbsp;</span></p><p>这些正好是一个优秀的新闻网需要作的，只不过原来是需要一大批的专业记者、资深编辑来完成，现在这都是<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/news-collect-software.htm"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">新闻<span xml:lang="EN-US" lang="EN-US">采集程序</span></span></span></a></span>自动来完成的，现在新闻来源可以是全世界，这就是相当有千万的记者免费的为你写稿！</p><p>还等什么，新闻门户、行业门户触手可得！</p><p>相关抓取演示：<span xml:lang="EN-US" lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/"><span xml:lang="EN-US" lang="EN-US"><span xml:lang="EN-US" lang="EN-US">实例演示</span></span></a></span></p></div>]]></description>
</item><item>
<title><![CDATA[中国与欧洲生活水平的真实差距]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=40366</link>
<author>Webextraction</author>
<pubDate>2008/9/28 14:51:41</pubDate>
<description><![CDATA[<a>　<font style="font-size: 18px;" color="#000066"><strong>由于汇率的原因,现在一欧元可
以兑换十元人民币,所以到了欧洲以后买什么东西都喜欢按照1:10换算一下,不换算还好,一换算竟然觉得什么东西都出奇的贵,甚至一度还认为欧洲人生活
在"水深火热"之中呢.仔细一想不是欧洲人生活在水深火热之中,而是按照1:10的比率把人民币换成欧元以后自己反倒有一种水深火热的感觉.经过在欧洲两
个多月的"流浪"生活以后最终得到了一个较为有用(或者说有趣)的发现,即要比较中国与欧洲两地生活水平的真实差距并不需要把两种货币换算来换算去,只要
以1:1的比率来算一算各自的收入与支出就能够看出中国老百姓与欧洲老百姓在生活水平上的真实差距了.</strong></font>
</a><p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
其实在比较之前我们就已经知道了结果,即中国老百姓的生活水平与欧洲人之间肯定存在着巨大的差距,毕竟欧洲基本上都是发达国家,而目前的中国不过还是一个
正在成长的发展中大国.我们知道和别人有差距,那么这种差距又到底有多大呢?下面我就以自己浅薄的认识来做个形象而有趣的比较.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>首先,我们假设一个中国人的收入是1000元人民币,这个收入是目前北京上海这类城市中的较低收入;我们也假设一个欧洲人的收入刚好也是1000元欧元,大体上来讲1000欧元也是西欧发达国家中的较低水平吧.OK,我们现在就来比较.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">一,住</font>.在中国,如果一个人的收入水平
是一千块人民币的话,那么在北京或者上海这样的城市最少也要花400元才能租到位置较差环境较差房屋质量也不大好的简陋居室容身.而在欧洲的许多城市里,
租一个地方让自己容身的话,基本上最便宜的房子也要400欧元左右.但是因为欧洲的城市大多都不大,所以即使400欧元租的房子也不会离市中心太远,况
且,在欧洲越是市中心的老城区(尤其是环境较差的地段)就往往越是便宜,相反,近郊区则多是豪宅的所在之地.好了,在不考虑房屋以及环境质量的情况下,在
住的这个环节就算是打了个平手吧.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">二,吃</font>.在中国,假设一个人的月收入是
一千块的话估计平时就多以面条或者盖饭打发了,在北京上海这样的城市里,最便宜的一餐饭差不多就算5块钱好了,而欧洲的大多数地方最便宜的快餐当属土尔其
烤肉,价格基本上是4欧元,只是土尔其烤肉只能站着吃或者边走边吃了.考虑到土尔其烤肉毕竟有肉,而且量还不少,所以在最基本的吃的方面咱们比人家稍逊一
些.如果以卖当劳做参考的话差距或许还要拉大一些,在欧洲一份巨无霸套餐是7欧元左右,而在中国则是21块左右.也正因此,卖当劳在欧洲几乎就是穷人的食
堂.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">三,穿</font>.在北京,便宜的服装很容易找
到.一条裤子或是一件质量一般的上衣用50块钱总还是买得到的,而如果在批发市场的话估计还可以再便宜个十块八块.那么欧洲呢?如果要花50欧元的话基本
上可以买一件正价的耐克或者阿迪达斯了,要是在小摊上5欧元就能买条能穿得出去的裤子,10块钱也能买得到一件没什么品位的上衣凑合.在穿的方面中国
1000元收入的购买力显然与欧洲存在着差距,但这种差距并不是那种跳起来都够不着的差距,毕竟中国是一个制衣大国,如果起个大早去趟早市的话,十来块钱
说不定也能淘到一件能上身的物件.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">四,行</font>.在北京,无论你收入有多少,坐
一次地铁的花费都是两块钱,欧洲则基本上是一欧元以上,但买磁卡的话坐一趟公交车只需要0.4元,这一点比欧洲要便宜一些(相对来讲上海则要比欧洲贵一
些,在维也纳只要花上5欧元就可以在一天之内无限制乘坐各种公交车辆了).但是,在乘坐火车和飞机的时候,咱们与人家的差距就大了.譬如说从巴黎到法国南
部的图鲁滋,花80欧元就可以买张卧铺夕发朝至,而大体同等的路程,在中国的话就需要两百元左右,值得欣慰的是咱中国的卧铺车厢与欧洲比并不逊色.道是坐
飞机的差距比较大,欧洲的廉价航空让你花40欧元就可以从巴黎飞到罗马,而同样的距离在中国即使是特价机票也需要三百多块,不过考虑到中国的航空公司是按
照国际价格购买的燃油,所以咱们的机票相对较贵是吃了汇率的亏-三百多块的打折机票刚好相当于30欧元.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">五,泡吧</font>.这一项的差距就太大了.在欧
洲的酒吧,如果不是旅游热点区域的话,一杯散装啤酒的价格也就是两三块钱,即使在旅游热点区域-譬如说巴黎的香榭丽舍大街,那散装啤酒的价格就涨到了七八
块一扎-不过相对于北京三里屯和上海的衡山路动辄四五十的价格来,欧洲泡吧的价格是相当便宜的.也正因为如此,即便是1000欧元的收入在欧洲也能泡得起
酒吧.在中国酒吧显然要"贵族"许多-我在水城威尼斯稍微偏僻的地段就曾花一欧元在酒吧里点了一杯红酒,要是在北京的话那杯红酒无论如何敢要我四十块人民
币.</strong></font></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">六,理发</font>.和国内的情况类似,在欧洲理发的价格也有贵俭之分,从5欧元到30欧元都有,名发型师的价格更是普通人无法接受的,但基本以十来块欧元的为多,在这一环节两地没有太大分别,只是欧洲的理发馆比较小但富有艺术气息;中国的发廊大但多没什么品位.</font></strong></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr><font style="font-size: 24px;" color="#ff0000">七,看病买药.<font style="font-size: 18px;" color="#003366">其
实关于看病我没有多大的发言权,因为无论在欧洲还是中国我基本上都没去过医院.只是听说欧洲人基本上全靠保险公司支付医疗费用,而中国,尤其是农民则全要
靠自己了.我在欧洲旅行期间发过一次烧,在法国的药店里买了一盒药花了4欧元,类似的药品在北京花4块钱也能买到,但服务员却拼命地向你推荐贵的.</font></font></font></strong></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr><font style="font-size: 24px;" color="#ff0000">&nbsp;<wbr>八,咖啡馆</font>.
在欧洲,尤其在意大利,如果站着喝杯咖啡的话最便宜的是0.7欧元,即便在巴黎最著名的有很多历史名人都曾经常光顾的花神咖啡馆,一杯卡布其诺的价格不外
乎七欧元,而德国柏林街头的流动咖啡车卖的卡布其诺则只需要一欧元.为国内所熟悉的星巴克在欧洲大多数城市的价格也都在三到五欧元之间,而在北京的话要想
喝杯咖啡怎么也要二十多块,不过说句公平的话国内的咖啡馆基本上比欧洲的咖啡馆舒适得多,很多还提供免费的无线上网,而在欧洲找一个提供免费无线上网的咖
啡馆也不是不可能,难!</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">九</font><font style="font-size: 24px;" color="#ff0000">,看电影</font>.在欧洲的大城市看场电影的价格多在8欧元左右,所以即使收入只有1000欧元也可以时不时地看回最新的大片.而北京上海的电影院就差打块牌子写上"老百姓与狗不得入内"了,挣一千块钱的人估计连电影院的门冲哪开都不知道吧.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">十,旅馆</font>.(在欧洲,即使是穷学生也能
出外旅行-甚至是出国旅行.欧洲有一种面向欧洲籍学生的铁路优惠票,三百欧洲左右就可以买一张火车联票,在一个多月的时间内允许无限制地乘坐火车旅行-题
外话)旅行的话就必须要住旅馆.在欧洲,最便宜的旅馆是宿营地,有的宿营地十来块钱就可以住一晚,宿营地里还能够洗个热水澡.欧洲青年出外游玩喜欢住青年
旅馆,尽管是六人间甚至八人间的上下铺但条件还是不错的,还可以免费使用厨房做饭以减少开销.住在同一个房间里的人说话时都是轻声细语,为了不影响他人连
走路和关门都是蹑手蹑脚.所以即使住在多人间也不用担心熟睡之后被吵醒.当然,如果不喜欢住多人间的话,在欧洲(除了旅游热点区域)的城市里很容易找到
40欧元左右的廉价旅馆-虽然是廉价旅馆,但在卫生条件和舒适程度上基本上不亚于北京两三百块左右的旅馆.但是挣1000块人民币的人恐怕是舍不得住三百
块钱的旅馆吧.可以说,在旅行的花费与舒适度上咱们与人家的差距是相当大的.</strong></font></p>
<p><font style="font-size: 18px;" color="#000066"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">十一,景点门票</font>.国内的旅游景点门票超
级贵,100块200块的景点门票大有人在.欧洲旅游景点的门票相对来说要便宜很多,很多著名的旅游景点甚至都是免费的.象巴黎的卢浮宫门票只要10欧
元,学生还可以免费或者半价.巴黎的艾菲尔铁塔只需要七八块钱,如果不坐电梯还可以打折.巴塞罗那的著名建筑设计师高迪设计的桂尔公园已经被联合国列为人
类文化遗产,但这个有围墙有大门的公园却向全世界的旅游者免费开放.比较之后我们发现中国的旅游景点是专门宰人的地方.</strong></font></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">十二,房价</font>.仅以房价较为便宜的柏林为
例.柏林全市的平均房价是1000欧元一平米,一个月收入1000欧元的人刚好可以用一个月的收入购买一平米的住宅,十年的收入可以买一套一百平米的住
宅.北京五环以内的房价都在一万以上,一个月收入1000人民币的人十个月的收入刚够买一平米,要想买套一百平米的住宅则需要近百年的时间,有趣的是那住
宅的使用期限却只有70年而已.</font></strong></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">十三,艺术观赏</font>.维也纳金色大厅在中国家喻户晓,平时在那里看一场音乐演出的门票最便宜的是三十多欧元,所以月收入1000欧元的人也可以不时地高雅高雅.北京一场音乐会的价格动辄几百块上千块,相应地也变成了有钱人去的地方,当然偶尔也有超级粉丝靠砸锅卖铁买张票高雅一下.</font></strong></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
<font style="font-size: 24px;" color="#ff0000">十四,汽车</font>.欧洲较便宜的汽车接近一万欧元,而中国最便宜的汽车是三万多,只是在质量上还无法达到欧洲经济型轿车目前的水平.考虑到制造汽车的原材料价格基本上都与国际接轨了,所以咱中国的经济型汽车价格是相当低的,但高档轿车的价格则远远地高过欧洲.</font></strong></p>
<p><strong><font color="#000066" size="4">&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
......</font></strong></p>
<p><font color="#000066" size="4"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
经过近三十年的经济高速发展,中国在解决老百姓基本生存和生活需要方面已经取得了长足的进步,普通人的基本生活质量也在不断缩小着与欧洲的差距,而且我们
之间的差距实际上要远远地小于人均GDP所体现出来的差距,这也就是为什么国际上还有另一种替代人均GDP的比较方法-即购买力平价法-来计算不同货币地
区的差距吧.客观上看,我们在<font color="#336600">享受型</font>消费方面还需要有一个较大的提升,或者换句话来说我们在基本实现了小康的基础上应该力求降低享受型消费的价格以使老百姓过上更舒适的生活-实际上两地最大的差别也就是在这些方面吧.</strong></font></p>
<p><font color="#000066" size="4"><strong>&nbsp;<wbr>&nbsp;<wbr>&nbsp;<wbr>
以上有不妥当不全面的地方请网友指正补充...</strong></font></p>]]></description>
</item><item>
<title><![CDATA[最全的在线查询网址集合]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38975</link>
<author>Webextraction</author>
<pubDate>2008/8/15 14:45:18</pubDate>
<description><![CDATA[<SPAN style="FONT-SIZE: 14pt; FONT-FAMILY: 宋体">
<P class=MsoNormal>只有你想不到的，没有你查不到的！！！</P>
<P class=MsoNormal><BR><A href="http://www.lxsk.com/idcard.aspx">http://www.lxsk.com/idcard.aspx</A>&nbsp; <BR>全国邮政业务资费（去邮局别让人蒙了啊）&nbsp;&nbsp; <BR><A href="http://www.chinapost.gov.cn/yyzn/zifei/indexzifei.htm">http://www.chinapost.gov.cn/yyzn/zifei/indexzifei.htm</A>&nbsp;&nbsp; <BR>在线ip地址专业查询定位 <BR><A href="http://www.123cha.com/ip/">http://www.123cha.com/ip/</A> <BR>全国主要城市地图查询&nbsp; <BR><A href="http://www.123cha.com/map/">http://www.123cha.com/map/</A>&nbsp; <BR>全国列车时刻查询&nbsp;&nbsp; <BR><A href="http://www.123cha.com/train/">http://www.123cha.com/train/</A>&nbsp; <BR>世界主要城市同步时间查询 <BR><A href="http://www.123cha.com/worldclock/">http://www.123cha.com/worldclock/</A> <BR>各国货币汇率换算 <BR><A href="http://www.123cha.com/currency-converter/">http://www.123cha.com/currency-converter/</A>&nbsp; <BR>12种语言在线翻译&nbsp; <BR><A href="http://www.123cha.com/tran/">http://www.123cha.com/tran/</A> <BR>国内邮政编码、长途电话区号查询 <BR><A href="http://www.123cha.com/postal/">http://www.123cha.com/postal/</A> <BR>在线免费度衡量换算转换器 <BR><A href="http://www.123cha.com/unit-converter/">http://www.123cha.com/unit-converter/</A>&nbsp; <BR>汉字简体繁体在线转换 <BR><A href="http://www.123cha.com/chinese-converter/">http://www.123cha.com/chinese-converter/</A> h&nbsp; <BR>搜索引擎收录情况、网站反向链接在线查询&nbsp; <BR><A href="http://www.123cha.com/search_engine/">http://www.123cha.com/search_engine/</A>&nbsp;&nbsp; <BR>人体生物钟周期在线查询 <BR><A href="http://www.fh21.com.cn/search/zhouqi.htm">http://www.fh21.com.cn/search/zhouqi.htm</A>&nbsp; <BR>人体疾病查询及医院药品大夫查询，这个有趣啊&nbsp;&nbsp; <BR><A href="http://health.sohu.com/medisearch.html">http://health.sohu.com/medisearch.html</A>&nbsp;&nbsp; <BR>手机型号，价格产地查询&nbsp; <BR><A href="http://www.3533.com/phone/">http://www.3533.com/phone/</A> <BR>API函数在线查询大全&nbsp; <BR><A href="http://www.hongen.com/pc/program/apiquery.htm">http://www.hongen.com/pc/program/apiquery.htm</A>&nbsp; <BR>全球当日股票行情查询 <BR><A href="http://stock.sina.com.cn/cgi-bin/stock/quote/lookup.cgi">http://stock.sina.com.cn/cgi-bin/stock/quote/lookup.cgi</A> <BR>全球黄页在线查询 <BR><A href="http://www.bridge69.com/365/sw/yellow.htm">http://www.bridge69.com/365/sw/yellow.htm</A>&nbsp;&nbsp; <BR>商务查寻类&nbsp; <BR>[酒店预定] <BR><A href="http://www.bridge69.com/chinese/hotel.htm">http://www.bridge69.com/chinese/hotel.htm</A> <BR>[中国专利检索] <BR><A href="http://www.bridge69.com/365/sw/1-2china-zhuanli.htm">http://www.bridge69.com/365/sw/1-2china-zhuanli.htm</A>&nbsp; <BR>[国际专利检索] <BR><A href="http://www.bridge69.com/365/sw/1-3guoji-zhuanli.htm">http://www.bridge69.com/365/sw/1-3guoji-zhuanli.htm</A>&nbsp; <BR>[外汇牌价] <BR><A href="http://202.102.239.182/hl/llhlcx.asp">http://202.102.239.182/hl/llhlcx.asp</A>&nbsp;&nbsp; <BR>[邮编电话区号] <BR><A href="http://www.cnyw.net/yzbm/index.asp?sm=%D5%E3%BD%AD">http://www.cnyw.net/yzbm/index.asp?sm=%D5%E3%BD%AD</A> <BR>[法律法规查询] <BR><A href="http://202.99.23.199/home/begin.cbs">http://202.99.23.199/home/begin.cbs</A> <BR>[股票行情查询] <BR><A href="http://www.gtja.com/gtja/quotation/stock.jsp">http://www.gtja.com/gtja/quotation/stock.jsp</A>&nbsp; <BR>[国内著名网站]&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/29web.htm">http://www.bridge69.com/365/cxdq/29web.htm</A>&nbsp;&nbsp; <BR>[数码相机报价]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/2-1shuma.htm">http://www.bridge69.com/365/sw/2-1shuma.htm</A> <BR>[农产品价格查询] <BR><A href="http://www.bridge69.com/365/sw/2-2nongchanpin.htm">http://www.bridge69.com/365/sw/2-2nongchanpin.htm</A> <BR>[火车时刻查询] <BR><A href="http://www.bridge69.com/365/sw/2-3train.htm">http://www.bridge69.com/365/sw/2-3train.htm</A> <BR>[中关村在线价格查询]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/2-4zhongguancun.htm">http://www.bridge69.com/365/sw/2-4zhongguancun.htm</A> <BR>[药品价格查询]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/sw/2-5yaoping.htm">http://www.bridge69.com/365/sw/2-5yaoping.htm</A> <BR>[国内航班查询] <BR><A href="http://www.bridge69.com/365/sw/2-6plane.htm">http://www.bridge69.com/365/sw/2-6plane.htm</A> <BR>[汽车报价查询] <BR><A href="http://www.bridge69.com/365/sw/2-7car.htm">http://www.bridge69.com/365/sw/2-7car.htm</A> <BR>[建材价格查询] <BR><A href="http://www.bridge69.com/365/sw/3-1jiancai.htm">http://www.bridge69.com/365/sw/3-1jiancai.htm</A> htt&nbsp; <BR>手机真假验正&nbsp; <BR><A href="http://www.bridge69.com/365/sw/3-2mobphone.htm">http://www.bridge69.com/365/sw/3-2mobphone.htm</A>&nbsp; <BR>[关税查询]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/sw/3-3guanshui.htm">http://www.bridge69.com/365/sw/3-3guanshui.htm</A> <BR>[WTO信息查询] <BR><A href="http://www.bridge69.com/365/sw/3-4wto.htm">http://www.bridge69.com/365/sw/3-4wto.htm</A> <BR>[法律查询]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/sw/3-5low.htm">http://www.bridge69.com/365/sw/3-5low.htm</A>&nbsp; <BR>[国际区号查询]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/3-6guoji.htm">http://www.bridge69.com/365/sw/3-6guoji.htm</A> <BR>实时航班动态&nbsp; <BR><A href="http://www.bridge69.com/365/sw/3-7shishi.htm">http://www.bridge69.com/365/sw/3-7shishi.htm</A> <BR>[展会查询] <BR><A href="http://www.bridge69.com/365/sw/3-8zhanhui.htm">http://www.bridge69.com/365/sw/3-8zhanhui.htm</A> <BR>[行业代码表查询] <BR><A href="http://www.bridge69.com/365/sw/dai%20ma.htm">http://www.bridge69.com/365/sw/dai%20ma.htm</A> <BR>[电脑报价查询] <BR><A href="http://www.bridge69.com/365/sw/4-1comptur.htm">http://www.bridge69.com/365/sw/4-1comptur.htm</A> <BR>[全球金融指数]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/sw/4-2jinron.htm">http://www.bridge69.com/365/sw/4-2jinron.htm</A> <BR>[国际UPS包裹追踪]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/4-3ups.htm">http://www.bridge69.com/365/sw/4-3ups.htm</A> <BR>[中国网站全球排行榜]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/4-4paihang.htm">http://www.bridge69.com/365/sw/4-4paihang.htm</A> <BR>[全球黄页]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/yellow.htm">http://www.bridge69.com/365/sw/yellow.htm</A>&nbsp; <BR>[在线各类字典大全]&nbsp; <BR><A href="http://www.bridge69.com/365/sw/dictionary.htm">http://www.bridge69.com/365/sw/dictionary.htm</A> <BR>[世界钢号对照]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/sw/4-7gan.htm">http://www.bridge69.com/365/sw/4-7gan.htm</A> <BR>[***商人专集]&nbsp; <BR><A href="http://www.bridge69.com/chinese/jpsr/index.htm">http://www.bridge69.com/chinese/jpsr/index.htm</A> <BR>[***贸易参考] <BR><A href="http://www.bridge69.com/chinese/rbmyck/index.htm">http://www.bridge69.com/chinese/rbmyck/index.htm</A>&nbsp; <BR>[***企业经营管理集]&nbsp; <BR><A href="http://www.bridge69.com/chinese/rbqygl/index.htm">http://www.bridge69.com/chinese/rbqygl/index.htm</A> <BR>[公证知识] <BR><A href="http://www.bridge69.com/365/sw/5-1gongzhe.htm">http://www.bridge69.com/365/sw/5-1gongzhe.htm</A> <BR>[中国百家姓的日文发音] <BR><A href="http://www.bridge69.com/365/sw/5-5baijiaxing.htm">http://www.bridge69.com/365/sw/5-5baijiaxing.htm</A> <BR>[唐诗三百首中日文对照] <BR><A href="http://www.bridge69.com/365/sw/5-6tansi300.htm">http://www.bridge69.com/365/sw/5-6tansi300.htm</A> <BR>[***人名的读法] <BR><A href="http://www.bridge69.com/365/sw/6-1japanese.htm">http://www.bridge69.com/365/sw/6-1japanese.htm</A> <BR>日常查寻类 <BR>[违章查询] <BR><A href="http://www.bridge69.com/365/cxdq/01.htm">http://www.bridge69.com/365/cxdq/01.htm</A> <BR><A href="http://www.bridge69.com/365/cxdq/1-2ems.htm">http://www.bridge69.com/365/cxdq/1-2ems.htm</A> <BR>[查询生辰八字] <BR><A href="http://www.bridge69.com/365/cxdq/03.htm">http://www.bridge69.com/365/cxdq/03.htm</A> <BR>[查身份证]&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/1-4shenfenzhen.htm">http://www.bridge69.com/365/cxdq/1-4shenfenzhen.htm</A> <BR>[农历公历互查系统] <BR><A href="http://www.bridge69.com/365/cxdq/05.htm">http://www.bridge69.com/365/cxdq/05.htm</A> <BR>[成语查寻] <BR><A href="http://www.bridge69.com/365/cxdq/1-6chenyu.htm">http://www.bridge69.com/365/cxdq/1-6chenyu.htm</A> <BR>[英语词典]&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/1-7english.htm">http://www.bridge69.com/365/cxdq/1-7english.htm</A> <BR>[手机地址]&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/08souji.htm">http://www.bridge69.com/365/cxdq/08souji.htm</A>&nbsp; <BR>[移动话费] <BR><A href="http://www.bridge69.com/365/cxdq/1-9yidong.htm">http://www.bridge69.com/365/cxdq/1-9yidong.htm</A> <BR>[联通话费] <BR><A href="http://www.bridge69.com/365/cxdq/2-1liantong.htm">http://www.bridge69.com/365/cxdq/2-1liantong.htm</A>&nbsp;&nbsp; <BR>[疾病查询]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/2-2jibing.htm">http://www.bridge69.com/365/cxdq/2-2jibing.htm</A>&nbsp;&nbsp; <BR>[药品查询] http<BR><A href="http://www.bridge69.com/365/cxdq/2-3yaoping.htm">http://www.bridge69.com/365/cxdq/2-3yaoping.htm</A> <BR>[景点查询] <BR><A href="http://www.bridge69.com/365/cxdq/2-4jingdian.htm">http://www.bridge69.com/365/cxdq/2-4jingdian.htm</A>&nbsp;&nbsp; <BR>[世界时间] htt<BR><A href="http://www.bridge69.com/365/cxdq/15shi.htm">http://www.bridge69.com/365/cxdq/15shi.htm</A> <BR>[电视节目]&nbsp;&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/2-6tv.htm">http://www.bridge69.com/365/cxdq/2-6tv.htm</A> <BR>[实时天气预报] <BR><A href="http://www.bridge69.com/365/cxdq/weather.htm">http://www.bridge69.com/365/cxdq/weather.htm</A><BR>[在线地图]&nbsp; <BR><A href="http://www.bridge69.com/365/cxdq/2-8map.htm">http://www.bridge69.com/365/cxdq/2-8map.htm</A></SPAN></P>
<P class=MsoNormal><SPAN style="FONT-SIZE: 14pt; FONT-FAMILY: 宋体">跟多相关资料搜集，请联系：</SPAN><SPAN lang=EN-US style="FONT-SIZE: 14pt"><A href="http://www.knowlesys.cn/">knowlesys</A><?xml:namespace prefix = o /><o:p></o:p></SPAN></P>
<P class=MsoNormal><SPAN style="FONT-SIZE: 14pt; FONT-FAMILY: 宋体">采集实例：</SPAN><SPAN lang=EN-US style="FONT-SIZE: 14pt"><A href="http://www.knowlesys.cn/cn/examples.htm">http://www.knowlesys.cn/cn/examples.htm</A><o:p></o:p></SPAN></P>]]></description>
</item><item>
<title><![CDATA[垂直搜索引擎发展的几个方向]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38953</link>
<author>Webextraction</author>
<pubDate>2008/8/14 17:41:01</pubDate>
<description><![CDATA[

<h2>

</h2><p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">互联网发展至今，其间历经浮躁、追捧、泡沫、寒冬，现在正逐步向人们的日常生活消费、工作空间延伸。人们对互联网的需求也从最初的娱乐、聊天日益转为</span>
<span style="font-family: 宋体;">更加实际的衣、食、住、行、求医、求职等。人们获取信息的渠道从最初的几大门户发展到习惯使用</span><span lang="EN-US">Google</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Baidu</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Yahoo</span><span style="font-family: 宋体;">这些通用的搜索引擎。</span>
<span style="font-family: 宋体;">然而这些行业通用的搜索引擎能满足用户更加个性化、细化的信息需求吗？</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">最近很多人在讨论搜索引擎的发展趋势，普通认为垂直搜索将是下个潜力市场。从</span><span lang="EN-US">Yahoo</span><span style="font-family: 宋体;">推出旅游搜索、</span><span lang="EN-US">Goolge</span><span style="font-family: 宋体;">的本地搜索、</span><span lang="EN-US">Baidu</span><span style="font-family: 宋体;">的地图搜索、可以看出这些通用搜索巨头所面临的竞争和搜索引擎的发展趋势。如果说搜索引擎的发展方向是垂直搜索，那么垂直搜索的发展方向又是什么？</span>
<span style="font-family: 宋体;">　　</span> <span style="font-family: 宋体;">　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">　<b style="">什么是垂直搜索？</b></span><b style=""> </b><b style=""><span style="font-family: 宋体;">　　</span> </b><b style=""><span style="font-family: 宋体;">　　</span><span lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">所谓垂直搜索，是针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是专、精、深，且具有行业色彩。它是与通用搜索引擎截然不同的引擎类型。垂直搜索引擎专注具体、深入的纵向服务，致力于某一特定领域内信息的全面和内容的深入，这个领域外的闲杂信息不收录。比如：用户搜索深圳市南山区的川菜馆的电话、菜单价格、交通指路等这就是一种垂直搜索。</span>
<span style="font-family: 宋体;">　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">搜索领域有句名言：就是用户无法描述知道他要找什么，除非让他看到想找的东西。微软研究院一名技术专家说：</span><span lang="EN-US">“75%</span><span style="font-family: 宋体;">的内容通用搜索引擎搜索不出来</span><span lang="EN-US">”</span><span style="font-family: 宋体;">。</span> <span style="font-family: 宋体;">而垂直搜索引擎的诞生则是为了更大程度的提高搜索的</span><span lang="EN-US">“</span><span style="font-family: 宋体;">查全率</span><span lang="EN-US">”</span><span style="font-family: 宋体;">和</span><span lang="EN-US">“</span><span style="font-family: 宋体;">查准率</span><span lang="EN-US">”</span><span style="font-family: 宋体;">。正如一句英文所说的</span><span lang="EN-US">“Anything
you can search at google you can buy on eBay”</span><span style="font-family: 宋体;">。垂直搜索引擎通过对行业领域内的信息模型和用户模型结构化的搜集或再组织，提供更多、更专业、个性化的行业相关服务，就比如，用著名的垂直搜索引擎</span><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm">knowlesys</a></span><span style="font-family: 宋体;">的</span><span lang="EN-US"><a href="http://www.knowlesys.com/"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">信息采集系统</span></span></a></span><span style="font-family: 宋体;">，我们很方便就可以得到自己的，专业化的数据。</span> <span style="font-family: 宋体;">　　</span>
</p>

<p class="MsoNormal" style="text-indent: 21.1pt;"><b style=""><span style="font-family: 宋体;">垂直搜索引擎的特点</span> </b><b style=""><span style="font-family: 宋体;">　　</span> </b><b style=""><span style="font-family: 宋体;">　　</span><span lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">垂直搜索引擎的数据来源于哪里？其一来源于所处行业的相关站点，比如：找酒店、旅游信息的搜索引擎</span><span lang="EN-US">.qunar </span><span style="font-family: 宋体;">的数据来源于：</span><span lang="EN-US"><a href="http://www.knowlesys.com/"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">乐思</span></span></a></span><span style="font-family: 宋体;">（</span><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/products.htm">knowlesys</a></span><span style="font-family: 宋体;">）全世界的搜集等。</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">其二</span> <span style="font-family: 宋体;">来源于自身平台。可能很多人认为来源于自身平台的搜索只能称为站内搜索，不应该定义成垂直搜索。我不同意这种观点。事实当某一平台上的信息达到足够量大的时候，比如</span><span lang="EN-US"> eBay</span><span style="font-family: 宋体;">、</span><span lang="EN-US">taobao</span><span style="font-family: 宋体;">上的商品数量达上百万种你能说他的搜索不是垂直搜索吗？况且垂直搜索本身就是从这些行业站点提取出数据的。</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">比如：找餐馆的搜索引擎</span> <span lang="EN-US">Gudumami.</span><span style="font-family: 宋体;">的数据全部来源于它的加盟商户所发布的信息，再由</span><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">信<span lang="EN-US">息采集</span></span></span></a></span><span style="font-family: 宋体;">软件进行搜集整理。当然，</span><span lang="EN-US">eBay</span><span style="font-family: 宋体;">、</span><span lang="EN-US">taobao</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Alibaba</span><span style="font-family: 宋体;">也属于垂直搜索引擎，从用户使用的行为过程来看也是先有搜索动作而后才会有交易，不过更多时候人们愿意</span> <span style="font-family: 宋体;">称他们为</span><span lang="EN-US">b2b</span><span style="font-family: 宋体;">、</span><span lang="EN-US">c2c</span><span style="font-family: 宋体;">交易平台。</span>
<span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">跟通用搜索引擎相比，垂直搜索引擎有哪些数据特性？垂直搜索引擎的数据倾向于结构化和格式化。比如在某个购物类的垂直搜索引擎上输入</span><span lang="EN-US">“mp3”</span><span style="font-family: 宋体;">就会出</span> <span style="font-family: 宋体;">现，该产品的相关属性如：内存、尺寸、大小、电池型号、价格、生产厂家等相关技术属性，有的还提供比价服务。在某餐饮搜索引擎的高级搜索针对一家餐馆的搜</span>
<span style="font-family: 宋体;">索属性设置多达</span><span lang="EN-US">300</span><span style="font-family: 宋体;">个选项，把你想到和没想到都列出来了，这就把搜索服务专业化、细致化、个性化了。</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">当然，垂直搜索引擎的广告模式也不会再仅是通用搜索引擎的那些套路。除了排名和竞价之外，还很多种广告营利模式。比如，加盟收入、订单提成、会员会费收入、交易费用收入等。由于垂直搜索引擎能提供更为集中的受众群体，因此它的</span><span lang="EN-US">“</span><span style="font-family: 宋体;">单次点击有效率</span><span lang="EN-US">”</span><span style="font-family: 宋体;">相比通用搜索引擎更为有效，风险更小。</span> <span style="font-family: 宋体;">　　</span>
<span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21.1pt;"><b style=""><span style="font-family: 宋体;">垂直搜索引擎的几个发展方向</span>
</b><b style=""><span style="font-family: 宋体;">　　</span>
</b><b style=""><span style="font-family: 宋体;">　</span><span lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">在搜索技术更深化发展后，垂直搜索未来将发展到哪几个方向，是很多业内人士都在讨论的问题。就我认为，它今后会向这几个方向发展。</span>
<span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">首先，目录再分类。与早期的网址分类搜索引擎相似，垂直搜索引擎只选定了某一特定行业或某一主题进行目录的细化分类，结合机器抓取行业相关站点的信息</span>
<span style="font-family: 宋体;">提供专业化的搜索服务。这种专业化的分类目录（或称主题指南、列表浏览），很容易让用户迅速知道自己要找的是什么，并且按目录点击就能找到。最近</span><span lang="EN-US">Looksmart</span><span style="font-family: 宋体;">在日本推出了专门搜索饮食方面文章的垂直搜索引擎</span><span lang="EN-US">LooksmartJapanesefood</span><span style="font-family: 宋体;">，这是</span><span lang="EN-US">Looksmart</span><span style="font-family: 宋体;">第一个</span> <span style="font-family: 宋体;">国外垂直搜索引擎。</span><span lang="EN-US">Looksmart</span><span style="font-family: 宋体;">甚至一口气推出了多达</span><span lang="EN-US">19</span><span style="font-family: 宋体;">个独立的垂直搜索引擎，分别涉足汽车、城市、教育、健康、家庭生活、赚钱、音乐、娱乐、运</span> <span style="font-family: 宋体;">动、时尚、科技游戏、</span> <span style="font-family: 宋体;">旅行。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">其次，垂直搜索引擎的第二个发展方向是深度挖掘型搜索，其特点是</span><span lang="EN-US">“</span><span style="font-family: 宋体;">元数据模型再组织、再整合、深度数据挖掘、互动性</span><span lang="EN-US">”</span><span style="font-family: 宋体;">。通过对元数据信息进入深度加工，该类垂直搜索引擎为用户提供网页搜索引擎无法做到的专业性、功能性、关联性、有的加入了用户信息管理以及信息发布互动</span>
<span style="font-family: 宋体;">功能，能很好地满足了用户对专业性、准确性、功能性、个性化的需求。现在国内垂直搜索的技术领先者</span><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">乐思</span></span></a></span><span style="font-family: 宋体;">，它们就是非常的专注于此，凭借技术的发展和经验的积累，他们现在在深度数据挖掘应用面上首屈一指，能够对任何网页的任何数据尽心精准的搜集。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">第三，垂直搜索可以向本地搜索拓展，其特点是借助于地图元素</span> <span style="font-family: 宋体;">来发展。到目前为止，各大搜索引擎</span><span lang="EN-US">Google</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Yahoo</span><span style="font-family: 宋体;">、</span><span lang="EN-US">msn</span><span style="font-family: 宋体;">都推出了本地搜索而且都相对成熟。国内很多人把本地搜索理解等同于地图搜索，这是一种观念</span>
<span style="font-family: 宋体;">上错误。地图搜索只是本地搜索的一个功能元素，就像本地的天气预报一样。本地搜索的关键需求在于人们大多是在本地购物、就餐、娱乐、健身、修车、喝咖啡、</span>
<span style="font-family: 宋体;">工作等。简单地说，去一个什么样地方吃饭要比怎么去重要，地图只是确定和帮助你找到这个地方的工具。如果你不知道一家餐馆是否有你喜欢的菜，也不知道他的</span>
<span style="font-family: 宋体;">消费水平，更不知道他的服务水平及顾客评论，但你知道乘什么车能到达这家餐馆，那么你会选择这家餐馆吗？</span><span lang="EN-US">Map </span><span style="font-family: 宋体;">不等于</span><span lang="EN-US"> local</span><span style="font-family: 宋体;">，但</span><span lang="EN-US">local</span><span style="font-family: 宋体;">一定包括</span><span lang="EN-US">map</span><span style="font-family: 宋体;">。不信你打开</span><span lang="EN-US">map.yahoo.com</span><span style="font-family: 宋体;">和</span><span lang="EN-US">Local.yahoo.com</span><span style="font-family: 宋体;">比较一下。国内的几大搜索引擎的本地搜</span> <span style="font-family: 宋体;">索从</span><span lang="EN-US">2005</span><span style="font-family: 宋体;">年初开始到现在却仍停留在地图</span><span lang="EN-US">+</span><span style="font-family: 宋体;">黄页</span><span lang="EN-US">+</span><span style="font-family: 宋体;">公交指路的地图搜索水平阶段。只有中搜的</span><span lang="EN-US">“</span><span style="font-family: 宋体;">搜索北京</span><span lang="EN-US">”</span><span style="font-family: 宋体;">有点接近本地搜索，可惜没有加地图定位功能，仍停</span> <span style="font-family: 宋体;">留在文本、图片展示的时代。国内做本地搜索的还有</span><span lang="EN-US">citysee</span><span style="font-family: 宋体;">等同样没提供地图定位功能。总体来说国内的本地搜索在数据挖掘、开放接口、信息共享方面和</span>
<span style="font-family: 宋体;">国外比存在很大差距，国外的垂直搜索已经形成了事实上的数据供应链关系。</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">第四种可能，垂直搜索引擎可以向搜索交易平台发展。垂直搜索引擎由于自身对行业的专注，使得它可以提供行业信息深度和广度的整合提供更加细致周到的服务。对消费领域可以推出针对某一行业的搜索交易平</span>
<span style="font-family: 宋体;">台。比如美容搜索、餐饮搜索、购物搜索、机票旅游搜索。这种交易平台针对的是小型商家，比如一家川菜馆，一个只有几个人机票代理商，一家美容院。他们甚至</span>
<span style="font-family: 宋体;">没有自己的站点，有些电话号码都是用的是私人的，你</span><span lang="EN-US">114</span><span style="font-family: 宋体;">根本查不到，但他们确实需要通过开展电子商务来获得更多的顾客。</span> <span style="font-family: 宋体;">　　</span> <span style="font-family: 宋体;">　　</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">最近，</span><span lang="EN-US"><a href="http://www.knowlesys.cn/"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">乐思</span></span></a></span><span style="font-family: 宋体;">等一批技术出众的的垂直搜索获得了一些政府、巨型企业的认可，强力地刺激了人们对垂直搜索市场认可和期待。相信在未来几年的互联网搜索市场垂直搜</span>
<span style="font-family: 宋体;">索引擎一定会得到更大的发间和机会</span></p>

<p class="MsoNormal"><span lang="EN-US"><o:p>&nbsp;</o:p></span></p>



]]></description>
</item><item>
<title><![CDATA[Web数据挖掘的研究现状与发展[论文]]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38952</link>
<author>Webextraction</author>
<pubDate>2008/8/14 17:38:27</pubDate>
<description><![CDATA[<a>　

</a><p class="MsoNormal"><span style="font-family: 宋体;">摘要</span><span lang="EN-US">: </span></p>

<p class="MsoNormal"><span style="font-family: 宋体;">随着网络技术的快速普及和迅猛发展，大量的使各种信息可以以几乎免费的成本在网络上获得，如何在这个全球最大的数据集合中发现有用信息成为</span><span lang="EN-US"><a href="http://www.knowlesys.cn/resource-integration.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">数据挖掘研究</span></span></a></span><span style="font-family: 宋体;">的热点。本文概要介绍了</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据挖掘在三个研究领域的研究现状及发展。</span></p>

<p class="MsoNormal"><span style="font-family: 宋体;">关键词：</span><span lang="EN-US"><a href="http://www.knowlesys.cn/net-info-resource.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">数据挖掘</span></span></a></span><span style="font-family: 宋体;">；</span><span lang="EN-US"><a href="http://www.knowlesys.cn/china-net-information.htm">Web<span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">挖掘</span></span></a></span><span style="font-family: 宋体;">；</span><span lang="EN-US"> </span></p>

<p class="MsoNormal"><span lang="EN-US">&nbsp;</span></p>

<p class="MsoNormal"><span lang="EN-US">1</span><span style="font-family: 宋体;">．</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘概述</span><span lang="EN-US"> </span></p>

<p class="MsoNormal"><span style="font-family: 宋体;">随</span> <span style="font-family: 宋体;">着以数据库、数据仓库等数据仓储技术为基础的信息系统在各行各业的应用，使海量数据不断产生。随之而来的问题是如此多的数据让人难以消化，无法从表面上看</span>
<span style="font-family: 宋体;">出他们所蕴涵的有用信息，更不用说有效地指导进一步的工作。如何从大量的数据中找到真正有用的信息成为人们关注的焦点，数据挖掘技术也正是伴随着这种需求</span>
<span style="font-family: 宋体;">从研究走向应用。</span></p>

<p class="MsoNormal" style=""><span style="font-family: 宋体;">近年来，随着互联网技术的快速普及和迅猛发展，使各种信息可以以非常低的成本在网络上获得，由于互联网在全球互连互通，可以从中取得的数据量难以计算，而且互联网的发展趋势继续看好，特别是电子商务的蓬勃发展为网络应用提供了强大支持，如何在</span><span lang="EN-US">WWW</span><span style="font-family: 宋体;">这个全球最大的数据集合中发现有用信息无疑将成为数据挖掘研究的热点。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘指使用数据挖掘技术在</span><span lang="EN-US">WWW</span><span style="font-family: 宋体;">数据中发现潜在的、有用的模式或信息。</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘研究覆盖了多个研究领域，包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">2</span><span style="font-family: 宋体;">．</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘流程</span><span lang="EN-US"> </span></p>

<p class="MsoNormal" style=""><span style="font-family: 宋体;">与传统数据和数据仓库相比，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上的信息是非结构化或半结构化的、动态的、并且是容易造成混淆的，所以很难直接以</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">网页上的数据进行数据挖掘，而必须经过必要的数据处理。典型</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘的处理流程如下</span><span lang="EN-US">[3]</span><span style="font-family: 宋体;">：</span></p>

<p class="MsoNormal" style="margin-left: 39pt; text-indent: -18pt;"><span lang="EN-US">1</span><span style="font-family: 宋体;">．查找资源：任务是从目标</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档中得到数据，值得注意的是有时信息资源不仅限于在线</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档，还包括电子邮件、电子文档、新闻组，或者网站的日志数据甚至是通过</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">形成的交易数据库中的数据。</span></p>

<p class="MsoNormal" style="margin-left: 39pt; text-indent: -18pt;"><span lang="EN-US">2</span><span style="font-family: 宋体;">．信息选择和预处理：任务是从取得的</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">资源中剔除无用信息和将信息进行必要的整理。例如从</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档中自动去除广告连接、去除多余格式标记、自动识别段落或者字段并将数据组织成规整的逻辑形式甚至是关系表。</span></p>

<p class="MsoNormal" style="margin-left: 39pt; text-indent: -18pt;"><span lang="EN-US">3</span><span style="font-family: 宋体;">．模式发现：自动进行模式发现。可以在同一个站点内部或在多个站点之间进行。</span></p>

<p class="MsoNormal" style="margin-left: 39pt; text-indent: -18pt;"><span lang="EN-US">4</span><span style="font-family: 宋体;">．模式分析：验证、解释上一步骤产生的模式。可以是机器自动完成，也可以是与分析人员进行交互来完成。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘作为一个完整的技术体系，在进行挖掘之前的信息获得</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">（</span><span lang="EN-US">Information
Retrieval</span><span style="font-family: 宋体;">）和</span><span lang="EN-US"><a href="http://www.knowlesys.cn/china-net-information.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">信息抽取</span></span></a>IE(Information
Extraction)</span><span style="font-family: 宋体;">相当重要。信息获得（</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">）的目的在于找到相关</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档，它只是把文档中的数据看成未经排序的词组的集合，而信息抽取</span><span lang="EN-US">(IE)</span><span style="font-family: 宋体;">的目的在于从文档中找到需要的数据项目，它对文档的结构合表达的含义感兴趣</span><span lang="EN-US">,</span><span style="font-family: 宋体;">它得一个重要任务就是对数据进行组织整理并适当建立索引。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">信息获得（</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">）和信息抽取</span><span lang="EN-US">(IE)</span><span style="font-family: 宋体;">技术的研究已近有很长时间，随着</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">技术的发展，基于</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">技术的</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">、</span><span lang="EN-US">IE</span><span style="font-family: 宋体;">得到了更多的重视。由于</span><span lang="EN-US">Web
</span><span style="font-family: 宋体;">数据量非常大，而且可能动态变化，用原来手工方式进行信息收集早已经力不从心，目前的研究方向是用自动化、半自动化的方法在</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上进行</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">和</span><span lang="EN-US">IE</span><span style="font-family: 宋体;">。在</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">环境下既要处理非结构化文档，又要处理半结构化的数据，最近几年在这两方面都有相应的研究成果和具体应用，特别是在大型搜索引擎中得到了很好的应用。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘分类及各自的研究现状及发展</span><span lang="EN-US"> </span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">根据对</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据的感兴趣程度不同，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘一般可以分为三类：</span><span lang="EN-US"><a href="http://www.knowlesys.cn/net-info-resource.htm">Web<span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">内容挖掘</span></span></a></span><span style="font-family: 宋体;">（</span><span lang="EN-US">Web Content mining</span><span style="font-family: 宋体;">）、</span> <span lang="EN-US"><a href="http://www.knowlesys.cn/resource-integration.htm">Web<span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">结构挖掘</span></span></a></span><span style="font-family: 宋体;">（</span><span lang="EN-US"> Web structure mining</span><span style="font-family: 宋体;">）、</span><span lang="EN-US"> Web</span><span style="font-family: 宋体;">用法挖掘（</span><span lang="EN-US">Web usage Mining</span><span style="font-family: 宋体;">）</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">1</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘：</span></p>

<p class="MsoNormal" style="margin-left: 21pt; text-indent: 21pt;"><span style="font-family: 宋体;">指从</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容</span><span lang="EN-US">/</span><span style="font-family: 宋体;">数据</span><span lang="EN-US">/</span><span style="font-family: 宋体;">文档中发现有用信息，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上的信息五花八门，传统的</span><span lang="EN-US">Internet</span><span style="font-family: 宋体;">由各种类型的服务和数据源组成，包括</span><span lang="EN-US">WWW</span><span style="font-family: 宋体;">、</span><span lang="EN-US">FTP</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Telnet</span><span style="font-family: 宋体;">等，现在有更多的数据和端口可以使用，比如政府信息服务、数字图书馆、电子商务数据，以及其他各种通过</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">可以访问的数据库。</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘的对象包括文本、图象、音频、视频、多媒体和其他各种类型的数据。其中针对无结构化文本进行的</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘被归类到基于文本的知识发现（</span><span lang="EN-US">KDT</span><span style="font-family: 宋体;">）领域，也称文本数据挖掘或文本挖掘，是</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘中比较重要的技术领域，也引起了许多研究者的关注。最近在</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">多媒体数据挖掘方面的研究成为另一个热点。</span></p>

<p class="MsoNormal" style="margin-left: 21pt; text-indent: 21pt;"><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘一般从两个不同的观点来进行研究。从资源查找（</span><span lang="EN-US">IR</span><span style="font-family: 宋体;">）的观点来看，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘的任务是从用户的角度出发，怎样提高信息质量和帮助用户过滤信息。而从</span><span lang="EN-US">DB</span><span style="font-family: 宋体;">的角度讲</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘的任务主要是试图对</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上的数据进行集成、建模，以支持对</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据的复杂查询。</span></p>

<p class="MsoNormal" style="margin-left: 21pt;"><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">1</span><span style="font-family: 宋体;">．</span><span lang="EN-US">1</span><span style="font-family: 宋体;">从</span><span lang="EN-US"><a href="http://www.knowlesys.cn/resource-integration.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">资源查找</span></span></a></span><span style="font-family: 宋体;">（</span><span lang="EN-US">Information Retrival</span><span style="font-family: 宋体;">）的观点挖掘非结构化文档：</span></p>

<p class="MsoNormal" style="margin-left: 21pt; text-indent: 21pt;"><span style="font-family: 宋体;">非结构化文档主要指</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上的自由文本，包括小说、新闻等。在这方面的研究相对比较多一些，大部分研究都是建立在词汇袋（</span><span lang="EN-US">bag of words</span><span style="font-family: 宋体;">）或称向量表示法（</span><span lang="EN-US">vector representation</span><span style="font-family: 宋体;">）</span> <span style="font-family: 宋体;">的基础上，这种方法将单个的词汇看成文档集合中的属性，只从统计的角度将词汇孤立地看待而忽略该词汇出现的位置和上下文环境。属性可以是布尔型，根据词汇</span>
<span style="font-family: 宋体;">是否在文档中出现而定，也可以有频度，即该词汇在文档中的出现频率。这种方法可以扩展为选择终结符、标点符号、不常用词汇的属性作为考察集合。词汇袋方法</span>
<span style="font-family: 宋体;">的一个弊端是自由文本中的数据丰富，词汇量非常大，处理起来很困难，为解决这个问题人们做了相应的研究，采取了不同技术，如信息增益，交叉熵、差异比等，</span>
<span style="font-family: 宋体;">其目的都是为了减少属性。另外，一个比较有意义的方法是潜在语义索引（</span><span lang="EN-US">Latent
Semantic Indexing</span><span style="font-family: 宋体;">），它通过分析不同文档中相同主题的共享词汇，找到他们共同的根，用这个公共的根代替所有词汇，以此来减少维空间。例如：“</span><span lang="EN-US">informing</span><span style="font-family: 宋体;">”、“</span><span lang="EN-US">information</span><span style="font-family: 宋体;">”、“</span><span lang="EN-US">informer</span><span style="font-family: 宋体;">”、“</span><span lang="EN-US">informed</span><span style="font-family: 宋体;">”可以用他们的根“</span><span lang="EN-US">inform</span><span style="font-family: 宋体;">”来表示，这样可以减少属性集合的规模。</span></p>

<p class="MsoNormal" style="margin-left: 21pt; text-indent: 21pt;"><span style="font-family: 宋体;">其他的属性表示法还有词汇在文档中的出现位置、层次关系、使用短语、使用术语、命名实体等，目前还没有研究表明一种表示法明显优于另一种。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span style="font-family: 宋体;">用资源查找（</span><span lang="EN-US">Information
Retrival</span><span style="font-family: 宋体;">）的观点</span><span lang="EN-US"><a href="http://www.knowlesys.cn/data-integration.htm"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">挖掘半结构化文档</span></span></a></span><span style="font-family: 宋体;">：</span></p>

<p class="MsoNormal" style="margin-left: 21pt; text-indent: 21pt;"><span style="font-family: 宋体;">与非结构化数据相比，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">上的半结构化文档挖掘指在加入了</span><span lang="EN-US">HTML</span><span style="font-family: 宋体;">、超连接等附加结构的信息上进行挖掘，其应用包括超连接文本的分类、聚类、发现文档之间的关系、提出半结构化文档中的模式和规则等。</span></p>

<p class="MsoNormal" style="text-indent: 21pt;"><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">1</span><span style="font-family: 宋体;">．</span><span lang="EN-US">2</span><span style="font-family: 宋体;">从数据库（</span><span lang="EN-US">Database</span><span style="font-family: 宋体;">）的观点挖掘非结构化文档：</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">数据库技术应用于</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘主要是为了解决</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">信息的管理和查询问题。这些问题可以分为三类：</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">信息的建模和查询；信息抽取与集成；</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">站点建构和重构。</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">从数据库的观点进行</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">内容挖掘主要是试图建立</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">站点的数据模型并加以集成，以支持复杂查询，而不止是简单的基于关键词的搜索。这要通过找到</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档的模式、建立</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据仓库或</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">知识库或虚拟数据库来实现。相关研究主要是基于半结构化数据进行的。</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">数据库观点主要利用</span><span lang="EN-US">OEM(Object Exchange Model)</span><span style="font-family: 宋体;">模型将半结构化数据表示成标识图。</span><span lang="EN-US">OEM</span><span style="font-family: 宋体;">中的每个对象都有对象标识（</span><span lang="EN-US">OID</span><span style="font-family: 宋体;">）和值，值可以是原子类型，如整型、字符串型、</span><span lang="EN-US">gif</span><span style="font-family: 宋体;">、</span><span lang="EN-US">html</span><span style="font-family: 宋体;">等，也可以是一个复合类型，以对象引用集合的形式表示。由于</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据量非常庞大，从应用的角度考虑，很多研究只处理办结构化数据的一个常用自集。一些有意义的应用是建立多层数据库（</span><span lang="EN-US">MLDB</span><span style="font-family: 宋体;">），每一层是它下面层次的概化，这样就可以进行一些特殊的查询和信息处理。对于在半结构化数据上的查询语言研究也得到了人们的重视并做了专题研究。</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">由于在数据库观点下数据的表示方法比较特殊，其中包含了关系层次和图形化的数据，所以大部分建立在扁平数据集合之上的数据挖掘方法不能直接使用，目前已经有人针对多层数据库挖掘算法进行研究。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">2</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">结构挖掘：</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span lang="EN-US"><a href="http://www.knowlesys.com/">Web<span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">结构挖掘</span></span></a></span><span style="font-family: 宋体;">的对象是</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">本身的超连接，即对</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档的结构进行挖掘。对于给定的</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">文档集合，应该能够通过算法发现他们之间连接情况的有用信息，文档之间的超连接反映了文档之间的包含、引用或者从属关系，引用文档对被引用文档的说明往往更客观、更概括、更准确。</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span lang="EN-US"><a href="http://www.knowlesys.com/">Web<span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">结构挖掘</span></span></a></span><span style="font-family: 宋体;">在一定程度上得益于社会网络和引用分析的研究。把网页之间的关系分为</span><span lang="EN-US">incoming</span><span style="font-family: 宋体;">连接和</span><span lang="EN-US">outgoing</span><span style="font-family: 宋体;">连接，运用引用分析方法找到同一网站内部以及不同网站之间的连接关系。在</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">结构挖掘领域最著名的算法是</span><span lang="EN-US">HITS</span><span style="font-family: 宋体;">算法和</span><span lang="EN-US">PageRank</span><span style="font-family: 宋体;">算法。他们的共同点是使用一定方法计算</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">页面之间超连接的质量，从而得到页面的权重。著名的</span><span lang="EN-US">Clever</span><span style="font-family: 宋体;">和</span><span lang="EN-US">Google</span><span style="font-family: 宋体;">搜索引擎就采用了该类算法。</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">此外，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">结构挖掘另一个尝试是在</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据仓库环境下的挖掘，包括通过检查同一台服务器上的本地连接衡量</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">结构挖掘</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">站点的完全性，在不同的</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">数据仓库中检查副本以帮助定位镜像站点，通过发现针对某一特定领域超连接的层次属性去探索信息流动如何影响</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">站点的设计。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">3</span><span style="font-family: 宋体;">．</span><span lang="EN-US">3</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">用法挖掘（</span><span lang="EN-US">Web usage Mining</span><span style="font-family: 宋体;">）：</span></p>

<p class="MsoNormal" style="margin-left: 42pt; text-indent: 21pt;"><span style="font-family: 宋体;">即</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">使用记录挖掘，在新兴的电子商务领域有重要意义，它通过挖掘相关的</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">日志记录，来发现用户访问</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">页面的模式，通过分析日志记录中的规律，可以识别用户的忠实度、喜好、满意度，可以发现潜在用户，增强站点的服务竞争力。</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">使用记录数据除了服务器的日志记录外还包括代理服务器日志、浏览器端日志、注册信息、用户会话信息、交易信息、</span><span lang="EN-US">Cookie</span><span style="font-family: 宋体;">中的信息、用户查询、鼠标点击流等一切用户与站点之间可能的交互记录。可见</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">使用记录的数据量是非常巨大的，而且数据类型也相当丰富。根据对数据源的不同处理方法，</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">用法挖掘可以分为两类，一类是将</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">使用记录的数据转换并传递进传统的关系表里，再使用</span><span lang="EN-US"><a href="http://www.knowlesys.cn/"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">数据挖掘</span></span></a></span><span style="font-family: 宋体;">算法对关系表中的数据进行常规挖掘；另一类是将</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">使用记录的数据直接预处理再进行挖掘。</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">用法挖掘中的一个有趣的问题是在多个用户使用同一个代理服务器的环境下如何标识某个用户，如何识别属于该用户的会话和使用记录，这个问题看起来不大，但却在很大程度上影响着挖掘质量，所以有人专门在这方面进行了研究。通常来讲，经典的</span><span lang="EN-US"><a href="http://www.knowlesys.cn/"><span style="font-family: 宋体;" lang="EN-US"><span lang="EN-US">数据挖掘</span></span></a></span><span style="font-family: 宋体;">算法都可以直接用到</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">用法挖掘上来，但为了提高挖掘质量，研究人员在扩展算法上进行了努力，包括复合关联规则算法、改进的序列发现算法等。</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">在</span><span lang="EN-US">[4]</span><span style="font-family: 宋体;">中，根据数据来源、数据类型、数据集合中的用户数量、数据集合中的服务器数量等将</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">用法挖掘分为五类：</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">●个性挖掘：针对单个用户的使用记录对该用户进行建模，结合该用户基本信息分析他的使用习惯、个人喜好，目的是在电子商务环境下为该用户提供与众不同的个性化服务。</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">●系统改进：</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">服务（数据库、网络等）的性能和其他服务质量是衡量用户满意度的关键指标，</span><span lang="EN-US">Web
</span><span style="font-family: 宋体;">用法挖掘可以通过用户的拥塞记录发现站点的性能瓶颈，以提示站点管理者改进</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">缓存策略、网络传输策略、流量负载平衡机制和数据的分布策略。此外，可以通过分析网络的非法入侵数据找到系统弱点，提高站点安全性，这在电子商务环境下尤为重要。</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">●站点修改：站点的结构和内容是吸引用户的关键。</span><span lang="EN-US">Web </span><span style="font-family: 宋体;">用法挖掘通过挖掘用户的行为记录和反馈情况为站点设计者提供改进的依，比如页面连接情况应如何组织、那些页面应能够直接访问等。</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">●智能商务：用户怎样使用</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">站点的信息无疑是电子商务销售商关心的重点，用户一次访问的周期可分为被吸引、驻留、购买和离开四个步骤，</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">用法挖掘可以通过分析用户点击流等</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">日志信息挖掘用户行为的动机，以帮助销售商合理安排销售策略。</span></p>

<p class="MsoNormal" style="margin-left: 36pt;"><span style="font-family: 宋体;">●</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">特征描述：这类研究跟关注这样通过用户对站点的访问情况统计各个用户在页面上的交互情况，对用户访问情况进行特征描述。</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">4</span><span style="font-family: 宋体;">．结束语</span><span lang="EN-US"> </span></p>

<p class="MsoNormal" style=""><span style="font-family: 宋体;">尽管</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘的形式和研究方向层出不穷，但我认为随着电子商务的兴起和迅猛发展，未来</span><span lang="EN-US">Web</span><span style="font-family: 宋体;">挖掘的一个重要应用方向将是电子商务系统。而与电子商务关系最为密切的是用法挖掘（</span><span lang="EN-US">Usage Mining</span><span style="font-family: 宋体;">），也就是说在这个领域将会持续得到更多的重视。另外，在搜索引擎的研究方面，结构挖掘的研究已经相对成熟，基于文本的内容挖掘也已经有许多研究，下一步将会有更多的研究者把多媒体挖掘最为研究方向。</span><span lang="EN-US"> </span></p>

<p class="MsoNormal" style=""><span style="font-family: 宋体;">参考文献：</span></p>

<p class="MsoBodyText"><span style="font-size: 10.5pt;" lang="EN-US">[1] Jiawei Han ,
Micheline Kamber. DataMining: Concept and Techniques. Morgan Kaufmann
Publishers,Inc.2001. </span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[2] <a href="http://www.knowlesys.com/">http://www.knowlesys.com</a></span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[3] R. Kosla and H. Blockeel, “Web mining research a survey,” <i>SIG
KDD Explorations</i>, vol. 2, pp. 1–15, July 2000. </span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[4] J. Srivastava, R. Cooley, M. Deshpande and P. Tan, Web usage
mining:discovery and applications of usage patterns from web data. <i>SIGKDDExplorations</i>,
1(2):12–23, 2000. </span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[5].S.K.Madria,S.S.Bhowmick,W.K.Ng,and E.P.Lim.Research issues in
web data mining.In Proceedings of Data Warehousing and Knowledge
Discovery,First International Conference,DaWaK’99,pages 303-312,1999.</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[6] Pal S.K., Talwar V., and Mitra P., Web Mining in SoftComputing
Framework: Relevance, State of he Art andFuture Directions, IEEE Transactions
on NeuralNetworks, Volume: 13, Issue: 5, pp.1163 –1177, 2002.</span></p>

<p class="MsoNormal" style=""><span lang="EN-US">[7] </span><span style="font-family: 宋体;">陈莉，焦李成</span><span lang="EN-US">.Internet/Web</span><span style="font-family: 宋体;">数据挖掘研究现状及最新进展</span><span lang="EN-US">.</span><span style="font-family: 宋体;">西安电子科技大学学报（自然科学版）</span><span lang="EN-US">.2007</span><span style="font-family: 宋体;">年</span><span lang="EN-US">2</span><span style="font-family: 宋体;">月第</span><span lang="EN-US">28</span><span style="font-family: 宋体;">卷第</span><span lang="EN-US">1</span><span style="font-family: 宋体;">期</span><span lang="EN-US">.</span></p>

]]></description>
</item><item>
<title><![CDATA[网页采集实例与结果演示]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38949</link>
<author>Webextraction</author>
<pubDate>2008/8/14 14:57:21</pubDate>
<description><![CDATA[<a>　

</a><table class="MsoNormalTable" style="width: 100%;" border="0" cellpadding="0" cellspacing="0" width="100%">
 <tbody><tr style="">
  <td style="padding: 7.5pt;">
  <p class="MsoNormal"><font size="3"><span lang="EN-US">&nbsp;&nbsp;</span><span style="font-family: 宋体;">如何将网页上的原始数据变成您数据库中的记录</span><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></font></p>
  </td>
 </tr>
</tbody></table>

<p class="MsoNormal"><span style="display: none;" lang="EN-US"><o:p>&nbsp;</o:p></span></p>

<div align="center">

<table class="MsoNormalTable" style="width: 90%;" border="0" cellpadding="0" cellspacing="0" width="90%">
 <tbody><tr style="">
  <td style="padding: 7.5pt;" valign="top">
  <table class="MsoNormalTable" style="width: 100%;" border="0" cellpadding="0" cellspacing="0" width="100%">
   <tbody><tr style="">
    <td colspan="4" style="padding: 0cm;" valign="top">
    <p style="margin-bottom: 12pt;">利用乐思公司独有的<span lang="EN-US"><a href="http://www.knowlesys.cn/information-use-and-extract.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集系统</span></span></a></span>，您可以将因特网上的各种类型的动态静态网站中有价值的数据批量，精确，高效地抽取到本地数据库中，整合为你的信息资产。以下是一些典型<span lang="EN-US"><a href="http://www.knowlesys.cn/website-extract.htm"><span lang="EN-US"><span lang="EN-US">采集</span></span></a></span>的输入页面与输出数据的屏幕截屏。</p>
    </td>
   </tr>
   <tr style="height: 366.75pt;">
    <td style="padding: 0cm; width: 8%; height: 366.75pt;" width="8%">
    <p class="MsoNormal"><span lang="EN-US">&nbsp;</span><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>
    </td>
    <td style="padding: 0cm; width: 74%; height: 366.75pt;" width="74%">
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/News_GZ/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">新闻采集--</span></span><span lang="EN-US"><span lang="EN-US">羊城晚报</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/News_Sina/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">新闻采集--</span></span><span lang="EN-US"><span lang="EN-US">新浪网</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/BBS/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">论坛帖子与回复采集</span></span></a>
    </span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Blog_RSS/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">博客文章(RSS XML)</span></span><span lang="EN-US"><span lang="EN-US">采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Company_Product/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">供应商公司与其产品采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/CompanyList/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">国外某行业公司名录采集</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Events_Table/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">全美体育俱乐部活动安排采集(</span></span><span lang="EN-US"><span lang="EN-US">复杂采集)</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/FileDownload/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">各类文件下载(</span></span><span lang="EN-US"><span lang="EN-US">需与数据库记录关联)</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Issue/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">期刊数字资源采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/JobList/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">招聘职位采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Master_Detail/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">具有一对多关系的产品与规格信息采集</span></span></a><br>
    <br>
    <a href="http://www.knowlesys.cn/cn/tutorial/examples/Movie_Comment/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">电影评论采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Product_Tool/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">工具电器产品信息采集</span></span></a></span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Require/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">供求信息采集</span></span></a> </span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/SalesLead/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">国内公<span lang="EN-US">司<span lang="EN-US">名录采集</span></span></span></span></a> </span></p>
    <p><span lang="EN-US"><a href="http://www.knowlesys.cn/cn/tutorial/examples/Text/index.html" target="_blank"><span lang="EN-US"><span lang="EN-US">各类文本采集</span></span></a></span></p>
    <p class="MsoNormal"><span lang="EN-US"></span><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>
    </td>
    <td style="padding: 0cm; width: 18%; height: 366.75pt;" width="18%">
    <p class="MsoNormal"><span lang="EN-US">&nbsp;</span><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>
    </td>
    <td style="padding: 0cm; height: 366.75pt;">
    <p class="MsoNormal"><span style="font-size: 10pt;" lang="EN-US"><o:p>&nbsp;</o:p></span></p>
    </td>
   </tr>
   <tr style="">
    <td colspan="4" style="padding: 0cm;">
    <p class="MsoNormal"><span style="color: rgb(255, 102, 0);" lang="EN-US"><br>
    </span><strong><span style="font-family: 宋体; color: rgb(255, 102, 0);">通过乐思网络信息采集系统，</span></strong><b><span style="color: rgb(255, 102, 0);" lang="EN-US"><br>
    </span></b><strong><span style="font-family: 宋体; color: rgb(255, 102, 0);">全球海量信息资源任您整合，为您所用！</span></strong></p><p class="MsoNormal"><strong><span style="font-family: 宋体; color: rgb(255, 102, 0);">更多信息，请查看：http://www.knowlesys.cn/</span></strong><b><span style="color: rgb(255, 102, 0);" lang="EN-US"><br>
    </span></b><strong><span style="font-family: 宋体; color: rgb(255, 102, 0);"></span></strong><strong><span style="color: rgb(255, 102, 0);" lang="EN-US"></span></strong><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>
    </td>
   </tr>
  </tbody></table>
  <p class="MsoNormal"><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>
  </td>
 </tr>
</tbody></table>

</div>

]]></description>
</item><item>
<title><![CDATA[乐思文本采集系统]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38946</link>
<author>Webextraction</author>
<pubDate>2008/8/14 14:34:25</pubDate>
<description><![CDATA[

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(0, 102, 204);">一、 主要功能</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-align: left;" align="left"><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_text_miner.htm"><span lang="EN-US"><span lang="EN-US">乐思</span></span></a></span><span style="font-size: 12pt; font-family: 宋体;">文本<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_text_miner.htm"><span lang="EN-US"><span lang="EN-US">采集系统</span></span></a></span>的主要功能为：根据用户自定义的任务配置，批量而精确地<span lang="EN-US"><a href="http://www.knowlesys.cn/extract-software.htm"><span lang="EN-US"><span lang="EN-US">抽取</span></span></a></span>目标文本文件中的内容，转化为为结构化的记录，保存在本地数据库中。
特别适用于<b><span style="color: rgb(102, 102, 102);">网络博客<span lang="EN-US">/Blog</span>文章采集，<span lang="EN-US">RSS/ATOM XML</span>内容采集，<span lang="EN-US">Text/CSV</span>内容采集，任意格式<span lang="EN-US">XML</span>采集，自定义结构文本内容采集</span></b>等。功能示意图如下所示： <span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(0, 102, 204);">二、 系统特点</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><!--[if gte vml 1]><v:shapetype id="_x0000_t75" coordsize="21600,21600"
 o:spt="75" o:preferrelative="t" path="m@4@5l@4@11@9@11@9@5xe" filled="f"
 stroked="f">
 <v:stroke joinstyle="miter"/>
 <v:formulas>
  <v:f eqn="if lineDrawn pixelLineWidth 0"/>
  <v:f eqn="sum @0 1 0"/>
  <v:f eqn="sum 0 0 @1"/>
  <v:f eqn="prod @2 1 2"/>
  <v:f eqn="prod @3 21600 pixelWidth"/>
  <v:f eqn="prod @3 21600 pixelHeight"/>
  <v:f eqn="sum @0 0 1"/>
  <v:f eqn="prod @6 1 2"/>
  <v:f eqn="prod @7 21600 pixelWidth"/>
  <v:f eqn="sum @8 21600 0"/>
  <v:f eqn="prod @7 21600 pixelHeight"/>
  <v:f eqn="sum @10 21600 0"/>
 </v:formulas>
 <v:path o:extrusionok="f" gradientshapeok="t" o:connecttype="rect"/>
 <o:lock v:ext="edit" aspectratio="t"/>
</v:shapetype><v:shape id="_x0000_i1025" type="#_x0000_t75" alt="" style='width:11.25pt;
 height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1025" border="0" height="15" width="15"><!--[endif]--></span></b><span style="font-size: 12pt; font-family: 宋体;">支持远程<span lang="EN-US">HTTP</span>或者<span lang="EN-US">FTP</span>服务器上的文本文件内容抽取<span lang="EN-US"> <br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1026" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1026" border="0" height="15" width="15"><!--[endif]--></b></span>支持本地文本文件内容抽取<span lang="EN-US"> <br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1027" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1027" border="0" height="15" width="15"><!--[endif]--></b></span>支持常用的文件格式<span lang="EN-US">: *.TXT,
*.CSV, *.XML, *.HTM<br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1028" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1028" border="0" height="15" width="15"><!--[endif]--></b></span>支持任意后缀名的文本文件<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1029" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1029" border="0" height="15" width="15"><!--[endif]--></b></span>内置六种记录块分割方式，几乎可以支持任意格式数据的抽取<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1030" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1030" border="0" height="15" width="15"><!--[endif]--></b></span>支持命令行格式，可以<span lang="EN-US">Windows</span>任务计划器配合，定期抽取目标数据<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1031" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1031" border="0" height="15" width="15"><!--[endif]--></b></span>支持记录唯一索引，避免相同信息重复入库<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1032" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1032" border="0" height="15" width="15"><!--[endif]--></b></span>支持<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/products/web_text_miner.htm"><span lang="EN-US"><span lang="EN-US">数据库</span></span></a></span>表结构完全自定义<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1033" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1033" border="0" height="15" width="15"><!--[endif]--></b></span>保证信息的完整性与准确性<span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1034" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1034" border="0" height="15" width="15"><!--[endif]--></b></span>支持各种主流数据库，如<span lang="EN-US">MSSQL</span>、<span lang="EN-US">Access</span>、<span lang="EN-US">MySQL</span>、<span lang="EN-US">Oracle</span>、<span lang="EN-US">DB2</span>、<span lang="EN-US">Sybase</span>等<span lang="EN-US"> <o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(0, 102, 204);">三、 运行环境</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-align: left;" align="left"><span style="font-size: 12pt; font-family: 宋体;">操作系统：<span lang="EN-US">Windows XP/NT/2000/2003 <br>
</span>内存：最低<span lang="EN-US">32M</span>内存，建议<span lang="EN-US">128M</span>或以上<span lang="EN-US"><br>
</span>硬盘：最少<span lang="EN-US">20M</span>空余硬盘空间<span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(0, 102, 204);">四、 行业应用</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"> <o:p></o:p></span></b></p>

<p class="MsoNormal" style="text-align: left;" align="left"><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US">Web Text Miner</span><span style="font-size: 12pt; font-family: 宋体;">主要用于：网络实时数据的抽取，本地特殊格式<span lang="EN-US"><a href="http://www.knowlesys.cn/"><span lang="EN-US"><span lang="EN-US">数据</span></span></a></span>的抽取<b>。</b><span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><!--[if gte vml 1]><v:shape id="_x0000_i1035" type="#_x0000_t75" alt=""
 style='width:18.75pt;height:15.75pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image002.gif"
  o:href="http://www.knowlesys.cn/images/right_orange.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image002.gif" v:shapes="_x0000_i1035" border="0" height="21" width="25"><!--[endif]--></span></b><b><span style="font-size: 12pt; font-family: 宋体;">门户网站</span></b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><o:p></o:p></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(102, 102, 102);">可以做到：</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"> <br>
<!--[if gte vml 1]><v:shape id="_x0000_i1036" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1036" border="0" height="15" width="15"><!--[endif]--></span></b><span style="font-size: 12pt; font-family: 宋体;">每天定时抽取目标网站的新闻<span lang="EN-US">RSS</span>聚合或者<span lang="EN-US">Blog</span>聚合中的信息<span lang="EN-US">(</span>标题<span lang="EN-US">,</span>作者<span lang="EN-US">,</span>内容等<span lang="EN-US">)</span>到<span lang="EN-US"><a href="http://www.knowlesys.cn/"><span lang="EN-US"><span lang="EN-US">数据库</span></span></a></span>中<span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(102, 102, 102);">利益<span lang="EN-US">:</span></span></b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1037" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1037" border="0" height="15" width="15"><!--[endif]--></b></span><span style="font-size: 12pt; font-family: 宋体;">轻松整合不同来源的<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/examples.htm"><span lang="EN-US"><span lang="EN-US">网络新闻</span></span></a></span>与<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/examples.htm"><span lang="EN-US"><span lang="EN-US">网络日志</span></span></a><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><!--[if gte vml 1]><v:shape id="_x0000_i1038" type="#_x0000_t75" alt=""
 style='width:18.75pt;height:15.75pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image002.gif"
  o:href="http://www.knowlesys.cn/images/right_orange.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image002.gif" v:shapes="_x0000_i1038" border="0" height="21" width="25"><!--[endif]--></span></b><b><span style="font-size: 12pt; font-family: 宋体;">股票证券行业<span lang="EN-US"><br>
<br>
</span><span style="color: rgb(102, 102, 102);">可以做到：</span><span lang="EN-US"> <br>
<!--[if gte vml 1]><v:shape id="_x0000_i1039" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1039" border="0" height="15" width="15"><!--[endif]--></span></span></b><span style="font-size: 12pt; font-family: 宋体;">每天定时自动将指定的远程文本文件或网页中的<span lang="EN-US"><a href="http://www.knowlesys.cn/extract-software.htm"><span lang="EN-US"><span lang="EN-US">行情数据采集</span></span></a></span>到数据库中<span lang="EN-US"><br>
<br>
</span><b><span style="color: rgb(102, 102, 102);">利益<span lang="EN-US">:</span></span></b><span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1040" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1040" border="0" height="15" width="15"><!--[endif]--></b></span>轻松获取<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/examples.htm"><span lang="EN-US"><span lang="EN-US">行情数据库</span></span></a><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1041" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1041" border="0" height="15" width="15"><!--[endif]--></b></span>实时行情分析<span lang="EN-US"> <br>
<br>
<br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1042" type="#_x0000_t75" alt=""
 style='width:18.75pt;height:15.75pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image002.gif"
  o:href="http://www.knowlesys.cn/images/right_orange.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image002.gif" v:shapes="_x0000_i1042" border="0" height="21" width="25"><!--[endif]--></b></span><b>金融行业</b><span lang="EN-US"><br>
<br>
</span><b><span style="color: rgb(102, 102, 102);">可以做到：</span><span lang="EN-US"> <br>
<!--[if gte vml 1]><v:shape id="_x0000_i1043" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1043" border="0" height="15" width="15"><!--[endif]--></span></b>每天定时自动将指定的远程文本文件或网页中的金融信息采集到数据库中<span lang="EN-US"><br>
<br>
</span><b><span style="color: rgb(102, 102, 102);">利益<span lang="EN-US">:</span></span></b><span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1044" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1044" border="0" height="15" width="15"><!--[endif]--></b></span>轻松获取<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/examples.htm"><span lang="EN-US"><span lang="EN-US">行情数据库</span></span></a><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1045" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1045" border="0" height="15" width="15"><!--[endif]--></b></span>实时行情分析<span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><!--[if gte vml 1]><v:shape id="_x0000_i1046" type="#_x0000_t75" alt=""
 style='width:18.75pt;height:15.75pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image002.gif"
  o:href="http://www.knowlesys.cn/images/right_orange.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image002.gif" v:shapes="_x0000_i1046" border="0" height="21" width="25"><!--[endif]--></span></b><b><span style="font-size: 12pt; font-family: 宋体;">科研机构</span></b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"><br>
<br>
</span><b><span style="font-size: 12pt; font-family: 宋体; color: rgb(102, 102, 102);">可以做到：</span></b><b><span style="font-size: 12pt; font-family: 宋体;" lang="EN-US"> <br>
<!--[if gte vml 1]><v:shape id="_x0000_i1047" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1047" border="0" height="15" width="15"><!--[endif]--></span></b><span style="font-size: 12pt; font-family: 宋体;">某些<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm"><span lang="EN-US"><span lang="EN-US">科研应用程序</span></span></a></span>的输出只能为文本文件，可以同过本软件将其转换到<span lang="EN-US"><a href="http://www.knowlesys.cn/cn/services.htm"><span lang="EN-US"><span lang="EN-US">数据库</span></span></a></span>中<span lang="EN-US"><br>
<br>
</span><b><span style="color: rgb(102, 102, 102);">利益<span lang="EN-US">:</span></span></b><span lang="EN-US"><br>
<b><!--[if gte vml 1]><v:shape id="_x0000_i1048" type="#_x0000_t75" alt=""
 style='width:11.25pt;height:11.25pt'>
 <v:imagedata src="file:///C:\DOCUME~1\new\LOCALS~1\Temp\msohtml1\01\clip_image001.gif"
  o:href="http://www.knowlesys.cn/images/li_blue.gif"/>
</v:shape><![endif]--><!--[if !vml]--><img src="file:///C:/DOCUME%7E1/new/LOCALS%7E1/Temp/msohtml1/01/clip_image001.gif" v:shapes="_x0000_i1048" border="0" height="15" width="15"><!--[endif]--></b></span>在无需编程人员的帮助下，就可以轻松转换数据，每分钟可以处理几十<span lang="EN-US">M</span>的数据<span lang="EN-US"><o:p></o:p></span></span></p>

<p class="MsoNormal" style="text-align: left;" align="left"><span style="font-size: 12pt; font-family: 宋体;">详细资料，请查看： <span lang="EN-US"><a href="http://www.knowlesys.cn/">http://www.knowlesys.cn</a><o:p></o:p></span></span></p>

<p class="MsoNormal"><span lang="EN-US"><o:p>&nbsp;</o:p></span></p>

]]></description>
</item><item>
<title><![CDATA[数据挖掘网址集合]]></title>
<link>http://blogger.org.cn/blog/more.asp?name=Webextraction&amp;id=38942</link>
<author>Webextraction</author>
<pubDate>2008/8/14 11:50:45</pubDate>
<description><![CDATA[

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">1. <a href="http://www.knowlesys.cn/auto-extract.htm"><span lang="EN-US"><span lang="EN-US">自动抓取，网络信息自动抓取，网页自<span lang="EN-US">动<span lang="EN-US">提取</span></span></span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
2. <a href="http://www.knowlesys.cn/china-net-information.htm"><span lang="EN-US"><span lang="EN-US">中国互联网络信息，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
3. <a href="http://www.knowlesys.cn/data-integration.htm"><span lang="EN-US"><span lang="EN-US">数据整合，网络信息采集，网页数据整合</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
4. <a href="http://www.knowlesys.cn/extract.htm"><span lang="EN-US"><span lang="EN-US">抓取，网页数据抓取</span></span></a><br>
5. <a href="http://www.knowlesys.cn/extract-software.htm"><span lang="EN-US"><span lang="EN-US">抓取软件，网络信息采集软件，网页数据抓取软件</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
6. <a href="http://www.knowlesys.cn/how-to-collect-information.htm"><span lang="EN-US"><span lang="EN-US">如何采集信息，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">8. <a href="http://www.knowlesys.cn/info-extraction.htm"><span lang="EN-US"><span lang="EN-US">信息采集，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
9. <a href="http://www.knowlesys.cn/info-extraction-sys.htm"><span lang="EN-US"><span lang="EN-US">信息采集系统，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a><br>
10. <a href="http://www.knowlesys.cn/info-extraction-tech.htm"><span lang="EN-US"><span lang="EN-US">信息采集技术，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">11. <a href="http://www.knowlesys.cn/info-extractor.htm"><span lang="EN-US"><span lang="EN-US">网站信息万能采集器，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">12. <a href="http://www.knowlesys.cn/info-manage-and-extract-software.htm"><span lang="EN-US"><span lang="EN-US">信息梳理和采集软件，网络信息采集，网页数据梳理</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">13. <a href="http://www.knowlesys.cn/information-collector.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集器，网页数据提取器</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
14. <a href="http://www.knowlesys.cn/information-collect-program.htm"><span lang="EN-US"><span lang="EN-US">信息采集程序，网络信息采集，网页数据提取程序</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
15. <a href="http://www.knowlesys.cn/information-collect-worker.htm"><span lang="EN-US"><span lang="EN-US">信息采集员，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
16. <a href="http://www.knowlesys.cn/information-integration.htm"><span lang="EN-US"><span lang="EN-US">信息整合，网络信息采集，网页数据整合</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
17. <a href="http://www.knowlesys.cn/information-resource-extract.htm"><span lang="EN-US"><span lang="EN-US">信息资源采集，网络信息采集，网页资源提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
18. <a href="http://www.knowlesys.cn/information-software.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集软件，网页数据提取软件</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
19. <a href="http://www.knowlesys.cn/information-use-and-extract.htm"><span lang="EN-US"><span lang="EN-US">信息利用与信息采集，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
20. <a href="http://www.knowlesys.cn/intergration-marketing.htm"><span lang="EN-US"><span lang="EN-US">整合营销 -- </span></span><span lang="EN-US"><span lang="EN-US">利用网络信息整合与网页数据整合</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">21. <a href="http://www.knowlesys.cn/net-collect.htm"><span lang="EN-US"><span lang="EN-US">网络采集，网络信息<span lang="EN-US">采集，网络数据提取</span></span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
22. <a href="http://www.knowlesys.cn/net-info-build.htm"><span lang="EN-US"><span lang="EN-US">信息网络建设，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a><br>
23. <a href="http://www.knowlesys.cn/net-info-resource.htm"><span lang="EN-US"><span lang="EN-US">网络信息资源，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">24. <a href="http://www.knowlesys.cn/net-information-collect-expert.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集专家，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
25. <a href="http://www.knowlesys.cn/net-information-collect-master.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集大师，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">21. <a href="http://www.knowlesys.cn/net-collect.htm"><span lang="EN-US"><span lang="EN-US">网络采集，网络信息采集，网络数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
22. <a href="http://www.knowlesys.cn/net-info-build.htm"><span lang="EN-US"><span lang="EN-US">信息网络建设，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a><br>
23. <a href="http://www.knowlesys.cn/net-info-resource.htm"><span lang="EN-US"><span lang="EN-US">网络信息资源，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">31. <a href="http://www.knowlesys.cn/page-database.htm"><span lang="EN-US"><span lang="EN-US">网页数据库，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
32. <a href="http://www.knowlesys.cn/page-extract.htm"><span lang="EN-US"><span lang="EN-US">网页抓取，网络信息采集，网页数据抓取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
33. <a href="http://www.knowlesys.cn/page-extract-tool.htm"><span lang="EN-US"><span lang="EN-US">乐思软件为您提供强大的网页抓取工具/</span></span><span lang="EN-US"><span lang="EN-US">网页数据抓取工具</span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">24. <a href="http://www.knowlesys.cn/net-information-collect-expert.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集专家，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
25. <a href="http://www.knowlesys.cn/net-information-collect-master.htm"><span lang="EN-US"><span lang="EN-US">网络信息采集大师，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">26. <a href="http://www.knowlesys.cn/net-info-search.htm"><span lang="EN-US"><span lang="EN-US">网络信息检索，网络信息采集，网页数据提取</span></span><span lang="EN-US"><span lang="EN-US">
</span></span></a><br>
27. <a href="http://www.knowlesys.cn/new-extraction-program.htm"><span lang="EN-US"><span lang="EN-US">新闻采集程序 -- </span></span><span lang="EN-US"><span lang="EN-US">用乐思新闻采集<span lang="EN-US">系统</span></span></span></a><br>
28. <a href="http://www.knowlesys.cn/news-auto-extraction-system.htm"><span lang="EN-US"><span lang="EN-US">新闻自动采集系统，网络信息自动采集，新闻采集</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
29. <a href="http://www.knowlesys.cn/news-collect-software.htm"><span lang="EN-US"><span lang="EN-US">新闻采集器，网络信息采集，网页新闻提取器</span></span></a><br>
30. <a href="http://www.knowlesys.cn/news-extraction-system.htm"><span lang="EN-US"><span lang="EN-US">新闻采集系统--</span></span><span lang="EN-US"><span lang="EN-US">乐思新闻采集系统是您的最佳选择</span></span></a></span></font></p>

<p style="margin: 0cm 0cm 0.0001pt;"><font size="3"><span lang="EN-US">34. <a href="http://www.knowlesys.cn/page-image-extractor.htm"><span lang="EN-US"><span lang="EN-US">网页图片抓取器--</span></span><span lang="EN-US"><span lang="EN-US">乐思软件定制网页图片抓取器</span></span></a><br>
35. <a href="http://www.knowlesys.cn/page-link-extractor.htm"><span lang="EN-US"><span lang="EN-US">网址抓取器</span></span><span lang="EN-US"><span lang="EN-US"> </span></span><span lang="EN-US"><span lang="EN-US">定制网址抓取器</span></span></a><br>
36. <a href="http://www.knowlesys.cn/page-picture-extract.htm"><span lang="EN-US"><span lang="EN-US">网页图片抓取，网页数据抓取，网络信息采集</span></span><span lang="EN-US"><span lang="EN-US"> </span></span></a><br>
37. <a href="http://www.knowlesys.cn/resource-integration.htm"><span lang="EN-US"><span lang="EN-US">资源整合 -- </span></span><span lang="EN-US"><span lang="EN-US">利用乐思信息采集系统进行网络资源整合</span></span></a><br>
38. <a href="http://www.knowlesys.cn/universal-information-extract.htm"><span lang="EN-US"><span lang="EN-US">通用信息采集--</span></span><span lang="EN-US"><span lang="EN-US">乐思通用网络信息采集系统问世了！</span></span></a><br>
39. <a href="http://www.knowlesys.cn/vertical-search-engine.htm"><span lang="EN-US"><span lang="EN-US">垂直搜索引擎</span></span><span lang="EN-US"><span lang="EN-US"> </span></span><span lang="EN-US"><span lang="EN-US">提供垂直搜索引擎采集系统</span></span></a><br>
40. <a href="http://www.knowlesys.cn/website-extract.htm"><span lang="EN-US"><span lang="EN-US">网站抓取</span></span><span lang="EN-US"><span lang="EN-US"> </span></span><span lang="EN-US"><span lang="EN-US">为您定制网站抓取软件</span></span></a></span></font></p>

]]></description>
</item>
</channel>
</rss>