用java 实现一个搜索功能,要求搜索某个关键字,然后把包括这个关键字的一段话输出到文档中。qq454284728

如题所述

一、什么叫搜索引擎?

在Internet上有上百亿可用的公共Web页面,即使是最狂热的冲浪者也不会访问到所有的页面,而只能看到其中的一小部分,更不会在这浩瀚的Web海洋中发现你那即使精彩却渺小的一隅。当然你可以为你的存在做广告,可以用大大的字把你的URL刻在你的身体上,然后裸体穿过白宫草坪,但你得保证媒体正好在那里,并注视到了这一切。与其这样做,不如好好去理解搜索引擎是如何工作的?又怎样选择和使用"keywords"(关键词)等等。
本文的目的就是让众多的页面设计者在了解搜索引擎的基础上,寻求如何使自己的页面在搜索引擎索返回的列表中获得好的排列层次的方法。

"搜索引擎"这个术语一般统指真正意义上的搜索引擎(也就是全文检索搜索引擎)和目录(即目录式分类搜索引擎),其实他们是不一样的,其区别主要在于返回的搜索结果列表是如何编排的。

1、目录

目录(比如Yahoo!)返回的列表是由人工来编排的。
这类引擎提供了一份人工按类别编排的网站目录,各类下边排列着属于这一类别的网站的站名和网址链接,再记录一些摘要信息,对该网站进行概述性介绍(摘要可能是你提交过去的,也可以是引擎站点的编辑为你的站点所做的评价)。人们搜索时就按相应类别的目录查询下去。
这类引擎往往还伴有网站查询功能,也称之为网站检索,即提供一个文字输入框和一个按钮。我们可以在文字框中输入要查找的字、词或短语,再点击按钮,便会在目录中查找相关的站名、网址和内容提要,将查到的内容列表送过来。目前国内Sohoo、常青藤等都是这种搜索方式。

2、搜索引擎

搜索引擎(如HotBot)是自动创建列表的。
搜索引擎看起来与目录的网站查询非常相似,也提供一个文字输入框和按钮,使用方法也相同,而且有些也提供分类目录,但两者却有本质上的区别。
目录的资料库中,搜集保存的是各网站的站名、网址和内容提要;搜索引擎的资料库中,搜集保存的则是各网站的每一个网页的全部内容,范围要大得多。
搜索引擎是以全文检索的方式工作的。全文检索查到的结果不是站名、网址和内容提要,而是与你输入的关键词相关的一个个网页的地址和一小段文字。在这段文字中,可能没有你输入的那个关键词,它只是某一网页的第一段话,甚至是一段无法看懂的标记,但在这个网页中,一定有你所输入的那个关键词,或者相关的词汇。打个比方说,网站查询可以查到网上有哪些报纸,如《文汇报》、《大公报》,而全文检索则可以查到网上这些报纸的每一篇文章中的词汇。

3、两者相结合的搜索引擎

某些搜索引擎同时也提供目录。包含在搜索引擎中的目录通常质量比较高,也能从那里找到许多好站点。因为即使你把你的站点提交过去,也并不能保证一定被加到目录中去,他们把注意力放在那些已经在别的目录中存在的站点上,并有选择地寻找有吸引力的加到自己的目录中。
搜索引擎和目录各有各自不可替代的功用。目录比较简单,要想获得一个好的排列层次,除了你努力创建一个好内容的高品质站点外别无他法。搜索引擎复杂得多,它们随时都在自动地索引众多WEB站点的最新网页,所以常常会发现目录所不能得到的信息。如果你改动了你的页面,搜索引擎还随时会发现这个变化,并重新排列你在列表中的位置。而目录就做不到。下面专门讨论搜索引擎的工作原理以及如何提高在搜索引擎列表中的排列位置。

搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。

搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。

早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。

随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。

然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、 标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。

怎样才能使搜索引擎精确地为人们提供相关的信息应该是它以后发展的方向,而不是只求综合服务。
搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。
搜索引擎的工作原理
搜索引擎的工作原理大致可以分为:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。

2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。

3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。

.
温馨提示:内容为网友见解,仅供参考
第1个回答  2011-07-20
用SQL的模糊查询可以吧追问

我想用java 开发个程序,用程序来实现

用java 实现一个搜索功能,要求搜索某个关键字,然后把包括这个关键字的一...
我们可以在文字框中输入要查找的字、词或短语,再点击按钮,便会在目录中查找相关的站名、网址和内容提要,将查到的内容列表送过来。目前国内Sohoo、常青藤等都是这种搜索方式。 2、搜索引擎 搜索引擎(如HotBot)是自动创建列表的。 搜索引擎看起来与目录的网站查询非常相似,也提供一个文字输入框和按钮,使用方法也相同...

怎么用java实现在一个txt文件中根据关键字查找信息并输出??
public static void readTxtFile(String filePath, String key){ try { String encoding="GBK";File file=new File(filePath);if(file.isFile() && file.exists()){ \/\/判断文件是否存在 InputStreamReader read = new InputStreamReader(new FileInputStream(file),encoding);\/\/考虑到编码格式 Bu...

java代码如何在百度输入关键字查询,再提取搜索结果呢?
如果是想用java代码实现的话,也简单。只要百度肯给你接口。拿到接口后,就可以通过接口来进行数据交互,可是一般来说,这个可能性会比较小。再就是说,也可以用技术桥接,不过这样是犯法的。基于这样的情况下,如果你想实现一个类似于百度这样的搜索功能。只有自己去创建一个这样的功能出来,网络上的很多...

java文件搜索引擎(java搜索功能)
Java中的搜索插件称为搜索引擎(SearchEngine),它是一种可以在网络上搜索内容的软件,可以帮助用户快速找到所需要的信息。搜索引擎使用爬虫来抓取网页中的内容,然后将网页内容组织成一个数据库,最后用户可以根据自己的需要使用搜索引擎检索相关信息。 Java中的搜索引擎有很多,其中最流行的搜索引擎包括Google、Bing、Yahoo、B...

如何用JAVA实现从一个.TXT 格式文件中,把输入的关键词所在行全部输出...
out.println();\/\/比如你想获取所有以110开头的行数据 String[] myStr = str.split("\\n");\/\/根据换行\\n来分割 for (int i = 0;i < myStr.length;i++) { if (myStr[i].contains("110")) { \/\/判断出现的关键字 System.out.println(myStr[i]); \/\/输出整行 } } } } ...

哪位朋友知道用java如何实现网络爬虫和搜索引擎的技术,说说原理最好...
lucene索引 首先爬虫是需要一个处理器链的,网页的抓取并非几十行代码就能实现的,因为有很多问题出 现。1.获取网页:判断网页编码,计算网页正文位置,获取页面内url(url的过滤、缓存、存储这部分还需要线程池的优化),url的分配、及线程池的启动。2.网页持久化。网页解析,网页中样式表、图片等下载...

编写程序实现文件内容搜索功能:从键盘输入文件名和待搜索单词,程序搜索...
这个是你要的程序,我在vc6下通过调试了,我的调试方法是在程序同文件下手建一个1.txt,txt内容为 theoiuwertheiou234 oiuasdf098the oiuadsftheou908 然后在主程序中路径输入1.txt,关键字输入the,输出的结果是 单词"the"一共在"1.txt"中出现4次 我的程序如下:include<stdio.h> include<...

java如何实现文件搜索功能
java实现文件搜索主要使用file类和正则表达式,如下示例:package com.kiritor.util;import java.io.File;import java.io.FileFilter;import java.util.Arrays;import java.util.Collections;import java.util.List;\/** * 文件的相关操作类 * * @author Kiritor *\/public class FileOperation {private ...

在java中若要使用一个包中的类时,首先要求对该包进行导入,其关键字
1、可以使用import关键字来导入一个包。例如使用importjava.util.*就可以导入名称空间java.util包里面的所有类。所谓导入这个包里面的所有类,就是在import声明这个包名以后,在接下来的程序中可以直接使用该包中的类。2、使用JNI技术,可以将Java代码编译成动态链接库(.so或.dll),然后在C语言中通过...

4.Java提供了一个关键字___,可以判断一个对象是否为某个类(或接口)的...
我们创建了一个字符串对象"str",然后使用"instanceof"关键字来判断"str"是否是String类的实例。如果是,则输出"str is an instance of String";否则,输出"str is not an instance of String"。通过使用"instanceof"关键字,我们可以在Java中进行对象类型的判断,以便根据实际情况做出相应的处理。

相似回答