Công nghệ tìm kiếm thông tin trên Internet: Các hệ thống truy xuất thông tin trên Internet. Chiến thuật và công cụ tìm kiếm có thể thay đổi đáng kể không chỉ tùy thuộc vào chủ đề mà còn phụ thuộc vào các tham số truy vấn khác.

Video hướng dẫn: Cách tạo truy vấn trong Microsoft Access trong 10 phút

Bài học: Sử dụng các công cụ của công cụ tìm kiếm (tạo truy vấn)

Các chức năng quan trọng nhất khi làm việc với cơ sở dữ liệu là bộ lọc thông tin, tìm kiếm và truy vấn.


Sắp xếp là quá trình sắp xếp thứ tự thông tin theo một số thuộc tính. Có các loại tăng dần và giảm dần. Nếu cơ sở dữ liệu có thông tin số, thì xếp hạng được sử dụng như là sắp xếp và nếu đó là thông tin dạng văn bản, thì sắp xếp theo thứ tự bảng chữ cái được sử dụng.


Khi xem xét sắp xếp theo hệ thống quản lý cơ sở dữ liệu trong MS Access, việc sắp xếp được thực hiện trong một trường duy nhất. Nếu một sắp xếp mới được sử dụng, thì các kết quả trước đó của nó sẽ bị mất. Nếu sắp xếp được lồng vào nhau, thì nó có thể được thực hiện bằng cách sử dụng một truy vấn.


Lọc là sự lựa chọn thông tin theo yêu cầu của người dùng. Bạn có thể đặt các điều kiện lựa chọn phức tạp.

Để tìm một số dữ liệu, bạn có thể sử dụng các ký tự đặc biệt được gọi là mặt nạ:


* - nghĩa là có thể chọn bất kỳ số ký tự nào.

? - thay vì ký tự này, có thể có bất kỳ ký tự nào được phép sử dụng.

# - bất kỳ số nào có thể được sử dụng thay thế cho ký tự này.

- bất kỳ ký tự nào trong ngoặc.

- - bất kỳ ký tự nào tương ứng với phạm vi đã chọn.

! - bất kỳ ký tự nào, ngoại trừ những ký tự được đặt trong dấu ngoặc vuông.

Bộ lọc theo dấu hiệu này có thể được sử dụng cho toàn bộ bảng hoặc cho một phần dữ liệu đã được chọn theo một số tiêu chí.

Cuộc điều tra- chức năng này có quy mô lớn và có thể bao gồm cả phân loại và lọc. Tính năng này cho phép bạn chọn dữ liệu trong nhiều trường và bảng. Bạn có thể tạo một thư viện truy vấn được lưu để sử dụng trong tương lai. Có một ngôn ngữ truy vấn SQL đặc biệt - có cấu trúc.

Công nghệ tìm kiếm

Các định luật ma sát và truyền nhiệt và khối lượng trong một lớp biên hỗn loạn

Có một số phiên bản của cách biểu diễn 'luật ma sátʼʼ (đối với trường hợp tham chiếu), dẫn đến các kết quả gần như giống hệt nhau. Phù hợp với khái niệm về lớp biên ʼʼlogaritʼʼ (với giá trị của hằng số nhiễu loạn đầu tiên χ = 0,4) định luật ma sát cho sự hỗn loạn cực kỳ phát triển với ʼʼ độ nhớt tăng cườngʼʼ được tính gần đúng bằng công thức Karman đơn giản:

Với biểu diễn định luật lũy thừa của cấu hình vận tốc, công thức nên được đề xuất:

ở đâu: ; n là số mũ của biên dạng vận tốc;

- hệ số bán kinh nghiệm;

NHƯNG- hệ số thực nghiệm;

δ là chiều dày của lớp biên.

Sử dụng tỷ lệ cho số Reynolds được xây dựng trên các đại lượng tuyến tính khác nhau:

Điều quan trọng cần lưu ý là đối với trường hợp phát triển một lớp ranh giới hỗn loạn từ cạnh hàng đầu ( x cr = 0) định luật ma sát cũng phải được biểu diễn dưới dạng:

Giá trị của các giá trị tham số của các công thức được trình bày cho các cấu hình vận tốc khác nhau được tóm tắt trong bảng

Tham số n
1/7 1/8 1/9 1/10
NHƯNG 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
m 0,250 0,222 0,200 0,182
B 0,0252 0,0206 0,0190 0,0148
m 1 0,200 0,182 0,167 0,154
B1 0,0576 0,0450 0,0362 0,0308

Các hình thức biểu diễn khác của định luật ma sát cũng được biết đến và sử dụng, dẫn đến những kết quả thực tế tương tự. Vì vậy, V.M. Ievlev đề xuất một ước lượng gần đúng:

Các công thức về định luật truyền nhiệt và khối lượng thu được từ các quy luật ma sátʼʼ cho các điều kiện tiêu chuẩn (trường hợp chuẩn) bằng nguyên lý tương tự bộ ba của Reynolds nổi tiếng.

ở đâu: S- hệ số hiệu chỉnh - Hệ số tương tự Reynolds đối với việc không tuân thủ các điều kiện của (các) tiêu chuẩn, hệ số S trong phép gần đúng đầu tiên là gần đúng thỏa mãn theo quan hệ:

Điều quan trọng cần lưu ý là đối với trường hợp sử dụng các tham số tích phân, các 'quy luậtʼʼ của nhiệt và truyền khối lượng được mô tả tốt bởi các phụ thuộc:

Công nghệ web World Wide Web (WWW) được coi là một công nghệ đặc biệt để chuẩn bị và sắp xếp các tài liệu trên Internet. WWW bao gồm các trang web, thư viện điện tử, danh mục và thậm chí cả bảo tàng ảo! Với lượng thông tin dồi dào như vậy, câu hỏi đặt ra gay gắt: ʼʼLàm thế nào để điều hướng trong một không gian thông tin khổng lồ và quy mô lớn như vậy - Các công cụ tìm kiếm ra đời để giải quyết vấn đề này.

Công cụ tìm kiếm là phần mềm đặc biệt với mục tiêu chính là cung cấp khả năng tìm kiếm thông tin chất lượng cao và tối ưu nhất cho người dùng Internet. Các công cụ tìm kiếm được lưu trữ trên các máy chủ web đặc biệt, mỗi máy chủ thực hiện một chức năng cụ thể:

1. Phân tích các trang web và nhập kết quả phân tích ở cấp độ này hoặc cấp độ khác của cơ sở dữ liệu của máy chủ tìm kiếm.

2. Tìm kiếm thông tin theo yêu cầu của người dùng.

3. Cung cấp giao diện thân thiện với người dùng để người dùng tìm kiếm thông tin và xem kết quả tìm kiếm.

Các phương pháp làm việc được sử dụng khi làm việc với các công cụ tìm kiếm này hoặc các công cụ tìm kiếm khác gần như giống nhau. Trước khi tiếp tục thảo luận về chúng, hãy xem xét các khái niệm sau:

1. Giao diện công cụ tìm kiếm được trình bày dưới dạng một trang với các siêu liên kết, một chuỗi truy vấn (chuỗi tìm kiếm) và các công cụ kích hoạt truy vấn.

2. Công cụ tìm kiếm chỉ mục - ϶ᴛᴏ cơ sở thông tin chứa kết quả phân tích các trang web, được biên soạn theo các quy tắc nhất định.

3. Truy vấn - ϶ᴛᴏ từ khóa hoặc cụm từ mà người dùng nhập vào thanh tìm kiếm. Các ký tự đặc biệt ("", ~), các ký hiệu toán học (*, +, -) được sử dụng để tạo thành các truy vấn khác nhau.

Sơ đồ tìm kiếm thông tin rất đơn giản. Người dùng nhập một cụm từ khóa và kích hoạt tìm kiếm, do đó nhận được lựa chọn tài liệu theo yêu cầu đã lập (cho sẵn). Danh sách tài liệu này được xếp hạng theo các tiêu chí nhất định để ở đầu danh sách là những tài liệu phù hợp nhất với truy vấn của người dùng. Mỗi công cụ tìm kiếm sử dụng các tiêu chí khác nhau để xếp hạng tài liệu, cả trong phân tích kết quả tìm kiếm và hình thành chỉ mục (điền vào cơ sở dữ liệu chỉ mục của các trang web).

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, nếu bạn chỉ định cùng một truy vấn trong chuỗi tìm kiếm cho mỗi công cụ tìm kiếm, bạn có thể nhận được các kết quả tìm kiếm khác nhau. Đối với người dùng, điều quan trọng là tài liệu nào sẽ xuất hiện trong hai hoặc ba tá tài liệu đầu tiên theo kết quả tìm kiếm và những tài liệu này tương ứng với mong đợi của người dùng ở mức độ nào.

Hầu hết các công cụ tìm kiếm cung cấp hai cách để tìm kiếm - tìm kiếm đơn giản(tìm kiếm đơn giản) và tìm kiếm nâng cao(tìm kiếm nâng cao) có và không có biểu mẫu yêu cầu đặc biệt. Hãy xem xét cả hai loại tìm kiếm trên ví dụ về công cụ tìm kiếm bằng tiếng Anh.

Ví dụ: AltaVista hữu ích cho các truy vấn tùy ý, ʼʼMột cái gì đó về bằng cấp trực tuyến trong công nghệ thông tinʼʼ, trong khi công cụ tìm kiếm của Yahoo cho phép bạn nhận tin tức thế giới, thông tin tỷ giá hối đoái hoặc dự báo thời tiết.

Nắm vững các tiêu chí để tinh chỉnh truy vấn và các kỹ thuật tìm kiếm nâng cao cho phép bạn tăng hiệu quả tìm kiếm và nhanh chóng tìm được thông tin cần thiết. Trước hết, bạn có thể tăng hiệu quả tìm kiếm bằng cách sử dụng các toán tử logic (phép toán) Hoặc, Và, Gần, Không, các ký hiệu toán học và đặc biệt trong các truy vấn. Với sự trợ giúp của toán tử và / hoặc ký hiệu, người dùng liên kết các từ khóa theo trình tự mong muốn để có được kết quả tìm kiếm thích hợp nhất cho truy vấn. Một truy vấn đơn giản trả về một số lượng nhỏ các tham chiếu đến tài liệu, bởi vì danh sách bao gồm các tài liệu có chứa một trong các từ được nhập trong khi truy vấn hoặc một cụm từ đơn giản (xem bảng 1). Toán tử and cho phép bạn chỉ định rằng tất cả các từ khóa nên được đưa vào nội dung tài liệu. Tuy nhiên, số lượng tài liệu vẫn phải lớn và cần có đủ thời gian để xem xét. Vì lý do này, trong một số trường hợp, việc sử dụng toán tử ngữ cảnh gần sẽ thuận tiện hơn nhiều, điều này chỉ ra rằng các từ phải được đặt ở vị trí đủ gần trong tài liệu. Sử dụng gần làm giảm đáng kể số lượng tài liệu được tìm thấy. Sự hiện diện của ký hiệu "*" trong chuỗi truy vấn có nghĩa là từ đó sẽ được tìm kiếm bằng mặt nạ của nó. Ví dụ, chúng ta hãy lấy một danh sách các tài liệu có chứa các từ bắt đầu bằng "gov", nếu chúng ta viết "gov *" trong chuỗi truy vấn. Đây là những từ chính phủ, thống đốc, v.v.

Dịch vụ tìm kiếm thông tin bằng tiếng Nga phát triển nhất được cung cấp bởi máy chủ tìm kiếm Yandex. Trong Yandex, bạn có thể chỉ cần viết bằng tiếng Nga một cụm từ mô tả những gì bạn muốn tìm và hệ thống sẽ phân tích và xử lý yêu cầu của bạn, sau đó cố gắng tìm mọi thứ liên quan đến một chủ đề nhất định. Bạn có thể, bằng cách sử dụng các toán tử đặc biệt, soạn một chuỗi giải thích cho công cụ tìm kiếm những yêu cầu của bạn đối với thông tin bạn quan tâm. Bạn có thể tìm thấy một số toán tử ngôn ngữ truy vấn Yandex tại đây: http://help.yandex.ru/search/ -id = 481939

Công cụ tìm kiếm Rambler phổ biến không kém giữ thống kê về lưu lượng liên kết từ cơ sở dữ liệu của riêng nó, cùng các toán tử logic VÀ, HOẶC, KHÔNG, ký tự siêu * (tương tự như ký tự * trong AltaVista mở rộng phạm vi truy vấn), ký hiệu hệ số + và -, để tăng hoặc giảm tầm quan trọng của các từ được nhập vào truy vấn.

Chúng ta hãy xem xét các công nghệ tìm kiếm thông tin phổ biến nhất trên Internet.

Chủ đề 3 Làm việc với các công cụ tìm kiếm trên Internet

Gửi công việc tốt của bạn trong cơ sở kiến ​​thức là đơn giản. Sử dụng biểu mẫu bên dưới

Các sinh viên, nghiên cứu sinh, các nhà khoa học trẻ sử dụng nền tảng tri thức trong học tập và làm việc sẽ rất biết ơn các bạn.

Lưu trữ tại http://www.allbest.ru/

Kế hoạch

  • Giới thiệu
  • Tìm kiếm thư mục
  • Công nghệ truy xuất thông tin
    • công cụ tìm kiếm
    • Liên kết Bộ sưu tập
    • Cơ sở dữ liệu địa chỉ
  • Đầu ra
  • Thư mục

Giới thiệu

Ngày nay, Internet kết hợp nhiều mạng khác nhau, hàng triệu máy tính, khoảng 300 triệu người dùng trên khắp các châu lục và theo nhiều ước tính, số lượng người dùng như vậy đang tăng 15-80% hàng năm. Có hai hướng chính trong việc sử dụng Internet trong kinh doanh. Đây là cách truy cập trực tuyến vào nguồn thông tin thực sự vô hạn về bất kỳ chủ đề nào (hàng trăm nghìn máy chủ thông tin), tìm kiếm và giao tiếp tương tác với các đối tác, trong hầu hết mọi chuyên ngành và vị trí địa lý. Làm thế nào để điều hướng trong một không gian thông tin rộng lớn như vậy? Có các công cụ tìm kiếm chuyên biệt cho việc này. Chúng có thể được chia thành các thư mục chuyên đề, rô bốt chỉ mục (công cụ tìm kiếm), hệ thống tìm kiếm meta.

danh mục tìm kiếm thông tin trên internet

Tìm kiếm thư mục

Nhiệm vụ chính của internet là cung cấp thông tin cần thiết. Để tìm thông tin bạn cần, bạn cần biết địa chỉ của trang Web chứa thông tin này. Cách tốt nhất để tìm thông tin trên Web là sử dụng các công cụ tìm kiếm. Công cụ tìm kiếm là một trang Web chuyên biệt. Các công cụ tìm kiếm được phân loại theo các phương pháp tìm kiếm.

Thư mục tìm kiếm được thiết kế để tìm kiếm theo chủ đề. Thông thường chúng được xây dựng trên cơ sở phân cấp, tức là mỗi bước tìm kiếm là việc lựa chọn một tiểu mục với chủ đề cụ thể hơn của thông tin bạn đang tìm kiếm. Ở cấp dưới cùng của tìm kiếm, người dùng nhận được một danh sách tương đối nhỏ các liên kết đến thông tin họ đang tìm kiếm.

Danh mục Tài nguyên Internet là một danh mục phân cấp được cập nhật liên tục và phát triển có chứa nhiều danh mục và máy chủ web riêng lẻ với mô tả ngắn gọn về nội dung của chúng. Phương pháp tìm kiếm danh mục liên quan đến việc "di chuyển xuống các bước", tức là chuyển từ các danh mục chung hơn sang các danh mục cụ thể hơn. Một trong những lợi thế của thư mục chuyên đề là những giải thích cho các liên kết được đưa ra bởi những người tạo ra thư mục và phản ánh đầy đủ nội dung của nó, tức là, nó cho bạn cơ hội để xác định chính xác hơn nội dung của máy chủ tương ứng với mục đích như thế nào. tìm kiếm của bạn.

Một ví dụ về danh mục chuyên đề tiếng Nga là tài nguyên http://www.ulitka.ru/.

Trên trang chính của trang web này có một phiếu đánh giá chuyên đề, với sự trợ giúp của người dùng trong phiếu đánh giá với các liên kết đến các sản phẩm mà anh ta quan tâm. Ngoài ra, một số thư mục chủ đề cho phép bạn tìm kiếm theo từ khóa. Người dùng nhập từ khóa mong muốn vào thanh tìm kiếm và nhận được danh sách các liên kết kèm theo mô tả về các trang web phù hợp nhất với truy vấn của mình. Cần lưu ý rằng việc tìm kiếm này không diễn ra trong nội dung của các máy chủ WWW, mà trong mô tả ngắn gọn của chúng được lưu trữ trong thư mục.

Danh mục chuyên đề được công nhận là phổ biến nhất trên toàn thế giới Yahoo!(http://www.yahoo.com). Nó là một cơ sở dữ liệu khổng lồ về các URL cho các trang web thuộc nhiều chủ đề khác nhau. Yahoo! mời bạn sử dụng cây phân cấp khi tìm kiếm thông tin. Những, cái đó. đầu tiên, một chủ đề chung được chọn đáp ứng yêu cầu thông tin, sau đó bạn chỉ định chủ đề đó, theo lời nhắc của danh mục. Kết quả cuối cùng, bạn nhận được danh sách các trang web chứa thông tin phù hợp với truy vấn của bạn. Trên Yahoo! bạn cũng có thể đi theo cách khác. Phân tích nội dung mong đợi của thông tin được yêu cầu và chọn những từ khóa chắc chắn sẽ xuất hiện trong các tài liệu hoặc tiêu đề mà bạn quan tâm. Nhập các từ này được phân tách bằng dấu cách trong dòng nhập trên trang chính Yahoo! và nhấn Enter. Hệ thống sẽ cố gắng tìm kiếm thông tin mà bạn quan tâm. Tại vì Yahoo! hệ thống là tiếng Anh, khá thuận tiện để sử dụng một trình dịch Internet, chẳng hạn như "Internet Socrates"(http://www.arsenal.ru).

Nếu bạn đang tìm kiếm thông tin rõ ràng là tiếng Nga, thì bạn nên sử dụng danh mục tiếng Nga và địa phương của Belarus. Nguyên tắc làm việc với chúng giống với nguyên tắc mà chúng ta đã xem xét trong ví dụ với Yahoo !. Ở đây, đáng chú ý là danh mục đầu tiên của Nga Nga trên mạng(http://www.ru), một trong những danh mục tiếng Nga lớn nhất List.RU(http://www.list.ru/), phiên bản tiếng Nga Yahoo!(http://www.yahoo.ru). Ngoài ra còn có một thư mục "Internet chòm sao", chỉ chứa các tài nguyên được chọn (được khai báo là thú vị nhất). Trong số các danh mục của Belarus, đáng chú ý là danh mục quốc gia của chúng tôi Yahoo!(http://unclesam.hypermart.net), một sản phẩm mới và sắp ra mắt dịch vụ 09(http://www.09.open.by), máy chủ Unibel(http://www.unibel.by) và một cơ sở dữ liệu nhỏ không có khả năng tìm kiếm Dữ liệu(http://www.data.minsk.by). Nhắc đến cơ sở dữ liệu, người ta không thể không nhớ đến dự án tuyệt vời của Nga "Trang vàng Internet"(http://www.piter-press.ru/yp), trong đó, như trong cuốn sách cùng tên, thông tin chi tiết về nhiều loại tài nguyên Internet được trình bày.

Trong kinh doanh, bạn cũng sẽ cần danh mục kinh doanh và danh mục sản phẩm và dịch vụ. Có lẽ là thư mục lớn nhất của các doanh nghiệp trong CIS Partner (http://trifle.net/cis).

Công nghệ truy xuất thông tin

Internet đang phát triển với tốc độ chóng mặt và việc tìm kiếm thông tin cần thiết cho một người dùng cụ thể không phải là rất dễ dàng. Nhưng hoàn toàn có thể, bởi vì mạng lưới có các tài nguyên sẽ giúp cả người mới bắt đầu và người chuyên nghiệp không bị chìm trong biển thông tin.

Sự xuất hiện của World Wide Web đã trở thành một bước nhảy vọt về số lượng và chất lượng trong lĩnh vực công nghệ thông tin. Số lượng tài nguyên mới và khối lượng thông tin mà chúng chứa đựng đang tăng lên như tuyết lở, số lượng kim chỉ nam trong “đống cỏ khô” thông tin và theo đó, kích thước của đống cỏ khô ngày càng tăng. Để tìm kiếm thông tin trên mạng, có các loại tài nguyên sau:

- cổng thông tin;

- danh mục tài nguyên Internet;

- công cụ tìm kiếm.

Bản thân Internet đã dần trở thành một phương tiện truyền thông với lượng lớn người dùng trên khắp thế giới và một lượng thông tin đáng kinh ngạc. Nó đã trở thành một phương tiện thông tin toàn cầu cuốn theo các kênh truyền thông trên toàn cầu, nhưng không hấp thụ được các phương tiện truyền thông mà chúng ta quen dùng, chúng đã hòa nhập một cách hữu cơ vào mạng lưới như những nguồn thông tin độc lập. Hầu hết mọi tờ báo, đài phát thanh hoặc kênh truyền hình ở bất kỳ quốc gia nào trên thế giới đều có hình ảnh đại diện của mình trên Internet.

Phiên bản điện tử của tờ báo có thể và theo quy luật, rất khác so với phiên bản báo giấy, vượt quá đáng kể về số lượng - định dạng dữ liệu được xuất bản trên các trang Internet linh hoạt hơn, không giới hạn số trang được phân bổ cho tài liệu. , các cột báo và tạp chí. Yếu tố tương tác xuất hiện - người đọc có thể để lại nhận xét và phản hồi của họ về bài báo đã đọc, tin tức và bài đánh giá phân tích.

Một số tạp chí định kỳ, chẳng hạn như TIMES, thậm chí đã số hóa tài liệu lưu trữ của tờ báo trong suốt thời gian tồn tại của nó, kể cả những năm chưa có máy tính hoặc mạng máy tính, tuy nhiên, việc tìm kiếm thông qua các kho lưu trữ như vậy phải trả phí và khá tốn kém.

Nguồn thông tin hoạt động có thẩm quyền và chuyên nghiệp nhất cho người sử dụng Internet và cho các phương tiện thông tin đại chúng là nguồn Web của các hãng thông tấn. Có mạng lưới phóng viên rộng khắp hàng ngày, hàng giờ trên Internet và thông qua các kênh thông tin điện tử để phổ biến thông tin chính trị - xã hội, kinh tế, khoa học, tài chính.

công cụ tìm kiếm

Công cụ tìm kiếm là phần mềm đặc biệt, mục đích chính là cung cấp khả năng tìm kiếm thông tin chất lượng cao và tối ưu nhất cho người dùng Internet. Các công cụ tìm kiếm được lưu trữ trên các máy chủ web đặc biệt, mỗi máy chủ thực hiện một chức năng cụ thể:

1. Phân tích các trang web và nhập kết quả phân tích ở cấp độ này hoặc cấp độ khác của cơ sở dữ liệu của máy chủ tìm kiếm.

2. Tìm kiếm thông tin theo yêu cầu của người dùng.

3. Cung cấp giao diện thân thiện với người dùng để người dùng tìm kiếm thông tin và xem kết quả tìm kiếm.

Các phương pháp làm việc được sử dụng khi làm việc với các công cụ tìm kiếm này hoặc các công cụ tìm kiếm khác gần như giống nhau. Trước khi tiếp tục thảo luận về chúng, hãy xem xét các khái niệm sau:

1. Giao diện công cụ tìm kiếm được trình bày dưới dạng một trang với các siêu liên kết, một chuỗi truy vấn (chuỗi tìm kiếm) và các công cụ kích hoạt truy vấn.

2. Chỉ mục của công cụ tìm kiếm là cơ sở thông tin chứa kết quả phân tích các trang web, được biên soạn theo những quy tắc nhất định.

3. Truy vấn là một từ khóa hoặc cụm từ mà người dùng nhập vào thanh tìm kiếm. Để tạo các truy vấn khác nhau, các ký tự đặc biệt ("", |, ~), các ký hiệu toán học (*, +,?) Được sử dụng.

Sơ đồ tìm kiếm thông tin rất đơn giản. Người dùng nhập một cụm từ khóa và kích hoạt tìm kiếm, do đó nhận được lựa chọn tài liệu theo yêu cầu đã lập (cho sẵn). Danh sách tài liệu này được xếp hạng theo các tiêu chí nhất định để ở đầu danh sách là những tài liệu phù hợp nhất với truy vấn của người dùng. Mỗi công cụ tìm kiếm sử dụng các tiêu chí khác nhau để xếp hạng tài liệu, cả trong phân tích kết quả tìm kiếm và hình thành chỉ mục (điền vào cơ sở dữ liệu chỉ mục của các trang web).

Do đó, nếu bạn chỉ định một truy vấn có cùng thiết kế trong chuỗi tìm kiếm cho mỗi công cụ tìm kiếm, bạn có thể nhận được các kết quả tìm kiếm khác nhau. Đối với người dùng, điều quan trọng là tài liệu nào sẽ xuất hiện trong hai hoặc ba tá tài liệu đầu tiên theo kết quả tìm kiếm và những tài liệu này tương ứng với mong đợi của người dùng ở mức độ nào.

Hầu hết các công cụ tìm kiếm cung cấp hai cách để tìm kiếm - tìm kiếm đơn giản(tìm kiếm đơn giản) và tìm kiếm nâng cao(tìm kiếm nâng cao) có và không có biểu mẫu yêu cầu đặc biệt. Hãy xem xét cả hai loại tìm kiếm trên ví dụ về công cụ tìm kiếm bằng tiếng Anh.

Ví dụ: AltaVista hữu ích cho các truy vấn tùy ý, "Đôi điều về bằng cấp trực tuyến trong công nghệ thông tin", trong khi công cụ tìm kiếm Yahoo cho phép bạn nhận tin tức thế giới, thông tin tỷ giá hối đoái hoặc dự báo thời tiết.

Nắm vững các tiêu chí tinh chỉnh truy vấn và các kỹ thuật tìm kiếm nâng cao cho phép bạn tăng hiệu quả tìm kiếm và nhanh chóng tìm được thông tin cần thiết. Trước hết, bạn có thể tăng hiệu quả tìm kiếm bằng cách sử dụng các toán tử logic (phép toán) Hoặc, Và, Gần, Không, các ký hiệu toán học và đặc biệt trong các truy vấn. Với sự trợ giúp của toán tử và / hoặc ký hiệu, người dùng liên kết các từ khóa theo trình tự mong muốn để có được kết quả tìm kiếm thích hợp nhất cho truy vấn.

Một truy vấn đơn giản cung cấp một số liên kết đến tài liệu, bởi vì danh sách bao gồm các tài liệu có chứa một trong các từ được nhập theo yêu cầu hoặc một cụm từ đơn giản (xem bảng 1). Toán tử and cho phép bạn chỉ định rằng tất cả các từ khóa nên được đưa vào nội dung tài liệu. Tuy nhiên, số lượng tài liệu có thể vẫn còn nhiều và có thể mất nhiều thời gian để xem xét chúng. Do đó, trong một số trường hợp, việc sử dụng toán tử ngữ cảnh gần sẽ thuận tiện hơn nhiều, điều này chỉ ra rằng các từ phải được đặt ở vị trí đủ gần trong tài liệu. Sử dụng gần làm giảm đáng kể số lượng tài liệu được tìm thấy. Sự hiện diện của ký hiệu "*" trong chuỗi truy vấn có nghĩa là từ đó sẽ được tìm kiếm bằng mặt nạ của nó. Ví dụ, chúng ta hãy lấy một danh sách các tài liệu có chứa các từ bắt đầu bằng "gov" nếu chúng ta viết "gov *" trong chuỗi truy vấn. Đây có thể là những từ chính phủ, thống đốc, v.v.

Dịch vụ tìm kiếm thông tin bằng tiếng Nga phát triển nhất được cung cấp bởi máy chủ tìm kiếm Yandex. Trong Yandex, bạn có thể chỉ cần viết bằng tiếng Nga một cụm từ mô tả những gì bạn muốn tìm và hệ thống sẽ phân tích và xử lý yêu cầu của bạn, sau đó cố gắng tìm mọi thứ liên quan đến một chủ đề nhất định. Bạn có thể, bằng cách sử dụng các toán tử đặc biệt, soạn một chuỗi giải thích cho công cụ tìm kiếm những yêu cầu của bạn đối với thông tin bạn quan tâm.

Công cụ tìm kiếm phổ biến không kém Rambler duy trì thống kê về lưu lượng liên kết từ cơ sở dữ liệu của riêng nó, cùng các toán tử logic VÀ, HOẶC, KHÔNG, ký tự siêu * (tương tự như ký tự * trong AltaVista mở rộng phạm vi truy vấn), ký hiệu hệ số + và - là được hỗ trợ để tăng hoặc giảm các từ quan trọng được nhập vào truy vấn.

Hầu hếtcông nghệ tìm kiếm Internet phổ biến.

Công cụ tìm kiếm

Công cụ tìm kiếm web là máy chủ có cơ sở dữ liệu khổng lồ gồm các URL tự động truy cập các trang WWW tại tất cả các địa chỉ này, kiểm tra nội dung của các trang này, hình thành và viết từ khóa từ các trang vào cơ sở dữ liệu của chúng (các trang chỉ mục).

Hơn nữa, rô bốt công cụ tìm kiếm theo các liên kết mà chúng gặp trên các trang và lập chỉ mục lại chúng. Vì hầu như bất kỳ trang WWW nào cũng có nhiều liên kết đến các trang khác, với công việc như vậy, công cụ tìm kiếm về mặt lý thuyết có thể bỏ qua tất cả các trang trên Internet.

Đây là loại công cụ tìm kiếm nổi tiếng và phổ biến nhất đối với tất cả người dùng Internet. Mọi người đều biết tên của các công cụ tìm kiếm web (search engine) nổi tiếng - Yandex, Rambler, Aport.

Để sử dụng loại công cụ tìm kiếm này, bạn cần vào nó và gõ vào thanh tìm kiếm từ khóa mà bạn quan tâm. Tiếp theo, bạn sẽ nhận được kết quả từ các liên kết được lưu trữ trong cơ sở dữ liệu của công cụ tìm kiếm gần nhất với truy vấn của bạn. Để tìm kiếm hiệu quả nhất, hãy chú ý trước những điểm sau:

Xác định chủ đề của yêu cầu. Chính xác thì bạn đang tìm kiếm điều gì?

Chú ý đến ngôn ngữ, ngữ pháp, cách sử dụng các ký tự không phải bảng chữ cái, hình thái học. Điều quan trọng là phải xây dựng và nhập từ khóa một cách chính xác. Mỗi công cụ tìm kiếm có hình thức yêu cầu riêng - nguyên tắc giống nhau, nhưng các ký hiệu hoặc toán tử được sử dụng có thể khác nhau. Các biểu mẫu yêu cầu bắt buộc cũng khác nhau tùy thuộc vào mức độ phức tạp của phần mềm công cụ tìm kiếm và các dịch vụ mà chúng cung cấp. Bằng cách này hay cách khác, mỗi công cụ tìm kiếm có một phần "Trợ giúp" ("Help"), nơi tất cả các quy tắc cú pháp, cũng như các khuyến nghị và mẹo để tìm kiếm, được giải thích theo cách dễ tiếp cận (ảnh chụp màn hình của các trang công cụ tìm kiếm).

Sử dụng khả năng của các công cụ tìm kiếm khác nhau. Nếu bạn không thể tìm thấy nó trên Yandex, hãy thử Google. Sử dụng các dịch vụ tìm kiếm nâng cao.

· Để loại trừ các tài liệu có chứa các thuật ngữ nhất định, hãy sử dụng dấu "-" trước mỗi từ như vậy. Ví dụ: nếu bạn muốn biết thông tin về các tác phẩm của Shakespeare, ngoại trừ "Hamlet", hãy nhập truy vấn dưới dạng: "Shakespeare-Hamlet". Và để đảm bảo rằng một số liên kết nhất thiết phải có trong kết quả tìm kiếm, hãy sử dụng ký hiệu "+". Vì vậy, để tìm các liên kết về việc bán ô tô cụ thể, bạn cần truy vấn "bán + ô tô". Để tăng hiệu quả và độ chính xác của tìm kiếm, hãy sử dụng kết hợp các ký tự này.

· Mỗi liên kết trong danh sách kết quả tìm kiếm chứa một đoạn trích - một vài dòng từ tài liệu được tìm thấy, trong đó các từ khóa của bạn được tìm thấy. Trước khi nhấp vào liên kết, hãy đánh giá mức độ liên quan của đoạn trích với chủ đề của yêu cầu. Sau khi nhấp vào liên kết đến một trang web cụ thể, hãy cẩn thận xem xét xung quanh trang chính. Theo quy định, trang đầu tiên đủ để hiểu bạn đã đến địa chỉ hay chưa. Nếu có, sau đó tiến hành tìm kiếm thêm thông tin cần thiết trên trang web đã chọn (trong các phần của trang web), nếu không, hãy quay lại kết quả tìm kiếm và thử liên kết tiếp theo.

· Hãy nhớ rằng các công cụ tìm kiếm không tạo ra thông tin độc lập (ngoại trừ các giải thích về chính chúng). Công cụ tìm kiếm chỉ là trung gian giữa chủ sở hữu thông tin (trang web) và bạn. Cơ sở dữ liệu được cập nhật liên tục, các địa chỉ mới được nhập vào chúng, nhưng tồn đọng từ thông tin thực sự tồn tại trên thế giới vẫn còn. Đơn giản vì các công cụ tìm kiếm không hoạt động với tốc độ ánh sáng.

Các công cụ tìm kiếm web nổi tiếng nhất bao gồm Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Trong số những người nói tiếng Nga, người ta có thể chọn ra Yandex, Rambler, Aport.

Công cụ tìm kiếm là công cụ lớn nhất và có giá trị nhất, nhưng không phải là nguồn thông tin duy nhất trên Web.

Liên kết Bộ sưu tập

Bộ sưu tập liên kết là các liên kết được sắp xếp theo chủ đề. Chúng khá khác nhau về nội dung, vì vậy để tìm được lựa chọn phù hợp nhất với sở thích của mình, bạn cần phải tự mình tìm hiểu chúng để hình thành ý kiến ​​của riêng mình.

Cơ sở dữ liệu địa chỉ

Cơ sở dữ liệu địa chỉ là các máy chủ tìm kiếm đặc biệt thường sử dụng phân loại theo loại hoạt động, sản phẩm và dịch vụ được cung cấp và theo địa lý. Đôi khi chúng được bổ sung bằng cách tìm kiếm theo thứ tự bảng chữ cái. Bản ghi cơ sở dữ liệu lưu trữ thông tin về các trang web cung cấp thông tin về địa chỉ e-mail, tổ chức và địa chỉ bưu điện có tính phí.

Cơ sở dữ liệu địa chỉ bằng tiếng Anh lớn nhất có thể được gọi là: http://www.lookup.com/ - là một công cụ đánh giá với nhiều thư mục con, chẳng hạn như: Tìm người, Số điện thoại, Tìm kiếm tên và các thư mục khác.

Vào các thư mục con này, người dùng tìm thấy các liên kết đến các trang web cung cấp thông tin mà anh ta quan tâm.

Đầu ra

Chúng tôi đã xem xét các công nghệ chính để tìm kiếm thông tin trên Internet và trình bày các thuật ngữ chung về các công cụ tìm kiếm hiện đang tồn tại trên Internet, cũng như cấu trúc của các truy vấn tìm kiếm cho các công cụ tìm kiếm bằng tiếng Nga và tiếng Anh phổ biến nhất, và, tổng hợp những điều trên, chúng tôi muốn lưu ý rằng một sơ đồ tối ưu duy nhất tìm kiếm thông tin trên Internet không tồn tại. Tùy thuộc vào thông tin cụ thể bạn cần, bạn có thể sử dụng các công cụ và dịch vụ tìm kiếm thích hợp. Và chất lượng của kết quả tìm kiếm phụ thuộc vào cách các công cụ tìm kiếm được lựa chọn thành thạo.

Tóm lại, chúng ta có thể nói rằng không có một sơ đồ tìm kiếm tối ưu nào trên Internet. Tùy thuộc vào thông tin cụ thể mà bạn cần, bạn nên sử dụng các dịch vụ tìm kiếm phù hợp để tìm thấy nó. Tất nhiên, về nguyên tắc, bạn luôn có thể sử dụng bất kỳ một công cụ tìm kiếm nào, chẳng hạn như Rambler, nhưng các dịch vụ tìm kiếm được lựa chọn thành thạo hơn và yêu cầu tìm kiếm thông tin được thực hiện thì kết quả tìm kiếm càng tốt. Và trong kinh doanh, chất lượng thông tin đóng một vai trò quan trọng.

Thư mục

1. Barabanov S. Intranet: từng bước // Máy tính bấm. - 1997. - Số 6. - tr.148-154.

2. Barabanov S. và các cộng sự Hệ thống máy tính: hôm qua, hôm nay, ngày mai // Máy tính báo chí. - 2007. - Số 2. - từ. 152-158.

3. Internet - tài nguyên.

Được lưu trữ trên Allbest.ru

Tài liệu tương tự

    Đặc điểm của tìm kiếm thông tin trên Internet: chiến lược và kỹ thuật. Công cụ tìm kiếm, thư mục và cổng thông tin tài nguyên. Lựa chọn và giới thiệu các từ khóa. Sử dụng chế độ "tìm kiếm nâng cao" mà mỗi công cụ tìm kiếm trên Internet đều có.

    trừu tượng, thêm 08/06/2014

    Phương tiện tìm kiếm thông tin trên Internet. Các yêu cầu cơ bản và phương pháp truy xuất thông tin. Cấu trúc và đặc điểm của dịch vụ tìm kiếm. Công cụ tìm kiếm toàn cầu WWW (World Wide Web). Lập kế hoạch tìm kiếm và thu thập thông tin trên Internet.

    tóm tắt, thêm 02.11.2010

    Cuộc cách mạng thông tin mà xã hội hiện nay đang trải qua. Thực hiện phân tích cấu trúc của tài liệu. Tìm kiếm thông tin tương tự trong các khu vực hệ thống. Tìm kiếm thông tin qua Internet. Các loại tài nguyên tìm kiếm: thư mục và rô bốt tìm kiếm.

    hạn giấy, bổ sung 16/12/2012

    Đặc điểm của các phương pháp tìm kiếm thông tin trên Internet, cụ thể là sử dụng các liên kết siêu văn bản, các công cụ tìm kiếm và các công cụ đặc biệt. Phân tích các nguồn tài nguyên Internet mới. Lịch sử của sự xuất hiện và mô tả của các công cụ tìm kiếm tiếng phương Tây và tiếng Nga.

    tóm tắt, bổ sung 05/12/2010

    Internet và các khả năng của nó. Một cách phổ biến và rẻ tiền để kết nối Internet. Sơ đồ truyền thông tin qua giao thức TCP / IP. Đặc điểm của địa chỉ của các lớp khác nhau. Các công cụ tìm kiếm, các phương pháp tìm kiếm và tải thông tin trong mạng toàn cầu.

    hạn giấy, bổ sung 25/09/2013

    Các giao thức chính được sử dụng trên Internet. Các công cụ tìm kiếm trên Internet. Các công cụ tìm kiếm phổ biến. Cách thức hoạt động của các công cụ tìm kiếm. Công cụ tìm kiếm và cấu trúc. Điều hướng tự động trên Web. tiêu chí hiệu suất của công cụ tìm kiếm.

    tóm tắt, thêm 14/02/2012

    Lịch sử của sự xuất hiện của Internet. Trang web, trang web, cổng thông tin. Tài nguyên Internet cơ bản: vị trí và nội dung. Thư viện, báo, tạp chí và các nguồn thông tin khác. Công cụ tìm kiếm, thư mục, kho lưu trữ. Giao tiếp qua Internet.

    hạn giấy, bổ sung 05/09/2012

    Cơ sở lý thuyết về các công nghệ Internet và các dịch vụ cơ bản của Internet. Làm quen với các khả năng kết nối Internet. Các dịch vụ mạng cơ bản. Nguyên tắc tìm kiếm thông tin trong WWW. Tổng quan về các trình duyệt Internet hiện đại. Các chương trình truyền thông trong mạng.

    hạn giấy, bổ sung 18/06/2010

    Dễ dàng tìm kiếm thông tin trong hệ thống "Google.ru", các công nghệ và chức năng của hệ thống. Lịch sử của thuật ngữ và ứng dụng của nó. Lựa chọn các điều kiện tìm kiếm, tự động loại trừ các từ phổ biến. Máy tính và chuyển đổi tiền tệ. Các trang liên quan và kiểm tra chính tả.

    tóm tắt, bổ sung 21/02/2011

    Tìm kiếm thông tin trên Internet: chiến lược và phương pháp luận. Danh mục toàn cầu và Nga và công cụ tìm kiếm: nguyên lý hoạt động, ưu điểm và nhược điểm. Đánh giá phân tích các tài liệu tìm được về chủ đề “Kế toán quỹ, chứng từ và các khoản đang chuyển đi”.


Sau khi nghiên cứu chủ đề này, bạn sẽ học và lặp lại:

Máy chủ tìm kiếm để làm gì?
- bổ nhiệm các bộ phận chính của máy chủ tìm kiếm;
- những loại tìm kiếm thông tin nào tồn tại trên Internet;
- các quy tắc cơ bản để tạo yêu cầu trong công cụ tìm kiếm Yandex.

Tìm kiếm theo URL

Cách nhanh nhất và đáng tin cậy nhất để tìm kiếm thông tin trên Internet là tìm kiếm các URL. Nhiều người trong số họ được phát hành trong các ấn phẩm in, sách tham khảo đặc biệt, được nghe trên sóng của các đài phát thanh nổi tiếng và từ màn hình TV.

♦ Những người hâm mộ câu lạc bộ bóng đá Zenit thuộc nằm lòng địa chỉ www.fc-zenit.ru.
♦ Các fan của nhóm "Korol i Shut" đều biết rõ về trang web chính thức của nhóm này là www.korol.spb.ru.
♦ Người hâm mộ kênh NTV có thể dễ dàng tìm thấy trang web của kênh tại www.ntv.ru. Để truy cập nhanh vào các tài nguyên trên, chỉ cần khởi chạy một chương trình trình duyệt, chẳng hạn như Internet Explorer và nhập một URL quen thuộc vào thanh địa chỉ.

Công cụ tìm kiếm

Có một lượng lớn tài liệu trên Internet. Để tạo điều kiện thuận lợi cho việc tìm kiếm thông tin cần thiết, các công cụ tìm kiếm đặc biệt được tạo ra.

công cụ tìm kiếm- Đây là các hệ thống tự động thăm dò các máy chủ được kết nối với mạng toàn cầu và lưu trữ thông tin về dữ liệu có sẵn trên các máy chủ trong cơ sở dữ liệu của chúng. Theo một yêu cầu được xây dựng đặc biệt, các công cụ tìm kiếm cung cấp thông tin về nơi bạn có thể lấy dữ liệu cần thiết.

Theo quy luật, công cụ tìm kiếm bao gồm ba phần: rô bốt, lập chỉ mục và chương trình xử lý yêu cầu.

Robot (Nhện, Robot hoặc Bot) là một chương trình truy cập các trang web và đọc (toàn bộ hoặc một phần) nội dung của chúng. Các rô bốt công cụ tìm kiếm khác nhau về sơ đồ riêng lẻ để phân tích nội dung của một trang web.
Chỉ mục công cụ tìm kiếm- đây là kho lưu trữ các hình ảnh tìm kiếm được truy cập bởi các trang rô bốt. Hình ảnh tìm kiếm của tài liệu (bao gồm cả trang web) là mô tả nội dung của tài liệu bằng ngôn ngữ truy xuất thông tin đặc biệt. Mô tả này chứa các mã cho các từ khóa của tài liệu, phản ánh ý nghĩa và nội dung của nó. Các chỉ mục trong mỗi công cụ tìm kiếm khác nhau về số lượng và cách thức lưu trữ thông tin. Cơ sở dữ liệu của các công cụ tìm kiếm hàng đầu lưu trữ thông tin về hàng chục triệu tài liệu và khối lượng chỉ mục của chúng là hàng trăm gigabyte. Các chỉ mục được cập nhật và bổ sung định kỳ, do đó, kết quả của công việc của một công cụ tìm kiếm với cùng một truy vấn có thể khác nhau nếu tìm kiếm được thực hiện vào những thời điểm khác nhau.

Yêu cầu xử lý là một chương trình, theo yêu cầu của người dùng, "tìm kiếm" chỉ mục về sự hiện diện của thông tin cần thiết và trả về các liên kết đến các tài liệu được tìm thấy. Tập hợp các liên kết ở đầu ra của hệ thống được chương trình phân phối theo thứ tự phù hợp giảm dần y, nghĩa là từ mức độ phù hợp cao nhất với yêu cầu đến mức thấp nhất.

Hiện tại, phổ biến nhất đối với người dùng Internet Nga là ba công cụ tìm kiếm loại chỉ mục chính:

Các hệ thống này có tính đến các đặc điểm ngữ pháp của tiếng Nga, vì vậy kết quả tìm kiếm của họ trong các nguồn thông tin bằng tiếng Nga có chất lượng cao hơn so với các hệ thống của phương Tây.

Các công cụ tìm kiếm khác nhau về mức độ bao phủ của các nguồn thông tin:

♦ Các công cụ tìm kiếm nói chung có một cơ sở dữ liệu về tất cả các lĩnh vực kiến ​​thức và được phân biệt bởi một chỉ mục mở rộng và một lượng lớn thông tin tích lũy;
♦ Các công cụ tìm kiếm có mục đích đặc biệt chỉ tìm kiếm các trang web có chủ đề cụ thể, chẳng hạn như các trang web về âm nhạc hoặc bảo tàng.

Các đặc điểm chính của công cụ tìm kiếm là:

♦ khối lượng tài liệu trong mục lục;
♦ tần suất cập nhật thông tin;
♦ không gian thông tin mà rô bốt công cụ tìm kiếm bao phủ và sự đa dạng của các loại tài liệu về thông tin được thu thập;
♦ yêu cầu tốc độ xử lý;
♦ tiêu chí để xác định mức độ liên quan (sự tương ứng của tài liệu được tìm thấy với truy vấn tìm kiếm);
♦ khả năng chi tiết hóa và làm rõ yêu cầu.

Tìm kiếm bằng phiếu đánh giá của công cụ tìm kiếm

Thư mục tìm kiếm là một tập hợp (chọn lọc) có hệ thống các liên kết đến các tài nguyên Internet khác. Các liên kết được tổ chức dưới dạng một công cụ đánh giá chuyên đề, là một cấu trúc phân cấp, di chuyển theo đó bạn có thể tìm thấy thông tin mình cần.

Hãy để chúng tôi làm ví dụ về cấu trúc của danh mục Internet tìm kiếm Yandex. Đây là một thư mục có mục đích chung, vì nó chứa các liên kết đến các tài nguyên Internet theo hầu hết các hướng có thể. Danh mục này bao gồm các chủ đề sau:

♦ Kinh doanh và kinh tế;
♦ Tài liệu tham khảo và liên kết;
♦ Xã hội và chính trị;
♦ Nhà và gia đình;
♦ Khoa học và giáo dục;
♦ Giải trí và nghỉ dưỡng;
♦ Máy tính và thông tin liên lạc;
♦ Văn hóa nghệ thuật.

Mỗi chủ đề bao gồm nhiều tiểu mục và những tiểu mục này lần lượt chứa các điểm đánh giá, v.v.

Giả sử bạn đang chuẩn bị một sự kiện cho Ngày Chiến thắng và muốn tìm kiếm trên Internet những lời trong bài hát quân sự nổi tiếng của Bulat Okudzhava "You hear the boots ầm ầm". Việc tìm kiếm có thể được tổ chức như sau: Danh mục Yandex Văn hóa và nghệ thuật Âm nhạc Bài hát của tác giả.

Phương pháp tìm kiếm này khá nhanh và hiệu quả. Cuối cùng, bạn chỉ được cung cấp 5 liên kết, trong số đó có các liên kết đến các trang web có các bài hát của những người nổi tiếng. Nó vẫn chỉ để tìm thấy trên trang web một kho lưu trữ với lời bài hát của B. Okudzhava và chọn văn bản mong muốn trong đó.

Một vi dụ khac. Giả sử bạn định mua một chiếc điện thoại di động và muốn so sánh các đặc điểm của các thiết bị từ các công ty khác nhau. Việc tìm kiếm có thể được thực hiện theo các tiêu đề danh mục sau: Danh mục Yandex Máy tính và thông tin liên lạc Truyền thông di động Điện thoại di động.

Sau khi nhận được một số tài liệu tham khảo hạn chế, bạn có thể nhanh chóng xem chúng và chọn một chiếc điện thoại bằng cách xem xét các đặc điểm của các hãng và các sửa đổi của thiết bị.

Tìm kiếm từ khóa

Hầu hết các công cụ tìm kiếm đều có khả năng tìm kiếm theo từ khóa. Đây là một trong những kiểu tìm kiếm phổ biến nhất. Để tìm kiếm theo từ khóa, bạn cần nhập một từ hoặc một số từ cần tìm vào một cửa sổ đặc biệt và nhấp vào nút Tìm kiếm. Công cụ tìm kiếm sẽ tìm thấy trong cơ sở dữ liệu của nó và hiển thị các tài liệu có chứa những từ này. Có thể có nhiều tài liệu như vậy, nhưng rất nhiều trong trường hợp này không nhất thiết có nghĩa là tốt.

Hãy tiến hành một số thử nghiệm với bất kỳ công cụ tìm kiếm nào. Giả sử chúng tôi quyết định bắt đầu một bể cá và chúng tôi quan tâm đến bất kỳ thông tin nào về chủ đề này.

Thoạt nhìn, điều đơn giản nhất là tìm kiếm từ "bể cá". Ví dụ, hãy kiểm tra điều này trong công cụ tìm kiếm Yandex. Kết quả tìm kiếm sẽ có hơn 460.000 trang trên 3.500 trang web - một số lượng lớn các liên kết. Hơn nữa, nếu bạn quan sát kỹ hơn, trong số đó sẽ có các trang web đề cập đến nhóm Thủy cung của B. Grebenshchikov, các trung tâm mua sắm và các hiệp hội không chính thức có cùng tên, và nhiều hơn nữa không liên quan đến cá cảnh.

Có thể dễ dàng đoán rằng một tìm kiếm như vậy không thể làm hài lòng ngay cả một người dùng bình thường. Sẽ phải dành quá nhiều thời gian để lựa chọn trong số tất cả các tài liệu được đề xuất có liên quan đến chủ đề chúng ta cần, và thậm chí nhiều hơn nữa để tìm hiểu nội dung của chúng.

Bạn có thể kết luận ngay rằng thông thường không nên tìm kiếm theo một từ, vì rất khó xác định chủ đề của một tài liệu, trang web hoặc trang web bằng một từ. Ngoại lệ là những từ hiếm và thuật ngữ hầu như không bao giờ được sử dụng bên ngoài chủ đề của chúng.

Hãy thử làm rõ các điều kiện tìm kiếm và nhập cụm từ "cá cảnh". Kết quả tìm kiếm sẽ có hơn 20.000 trang và khoảng 650 trang. Như bạn thấy, số lượng liên kết đã giảm hơn 20 lần. Kết quả này phù hợp với chúng tôi hơn, nhưng tất cả đều giống nhau, trong số các liên kết được đề xuất mà bạn có thể gặp, ví dụ: bộ lưu niệm của Nga gồm nhãn đối sánh với hình ảnh cá và bộ sưu tập bảo vệ màn hình máy tính để bàn và danh mục cá cảnh có ảnh và bể cá các cửa hàng phụ kiện.

Rõ ràng là chúng ta nên tiếp tục đi theo hướng tinh chỉnh các điều kiện tìm kiếm.

Để làm cho việc tìm kiếm hiệu quả hơn, tất cả các công cụ tìm kiếm đều có một ngôn ngữ truy vấn đặc biệt với cú pháp riêng của nó. Các ngôn ngữ này tương tự nhau về nhiều mặt. Học tất cả chúng khá khó, nhưng bất kỳ công cụ tìm kiếm nào cũng có hệ thống trợ giúp cho phép bạn thành thạo ngôn ngữ mong muốn.

Dưới đây là mười quy tắc đơn giản để tạo một yêu cầu trong công cụ tìm kiếm Yandex.

1. Từ khóa trong truy vấn phải được viết bằng chữ thường (nhỏ). Điều này sẽ đảm bảo rằng tất cả các từ khóa đều được tìm kiếm, không chỉ những từ khóa bắt đầu bằng chữ hoa.

2. Việc tìm kiếm có tính đến tất cả các dạng của từ theo các quy tắc của ngôn ngữ Nga, bất kể dạng của từ trong truy vấn. Ví dụ: nếu từ “biết” được chỉ định trong truy vấn, thì các từ “biết”, “biết”, v.v. cũng sẽ đáp ứng điều kiện tìm kiếm.

3. Để tìm kiếm một cụm từ ổn định, bạn nên đặt các từ trong dấu ngoặc kép, ví dụ: “bát đĩa sứ”.

4. Để tìm kiếm theo dạng từ chính xác, bạn phải đặt dấu chấm than trước từ đó. Ví dụ: để tìm kiếm từ "Tháng 9" trong trường hợp thông minh, bạn sẽ viết "! Tháng 9".

5. Để tìm kiếm trong một câu, các từ trong truy vấn được phân tách bằng dấu cách hoặc dấu &: "tiểu thuyết phiêu lưu" hoặc "phiêu lưu & tiểu thuyết". Một số từ được nhập trong truy vấn, được phân tách bằng dấu cách, có nghĩa là tất cả chúng phải được đưa vào một câu của tài liệu đang được tìm kiếm.

6. Nếu bạn chỉ muốn chọn những tài liệu trong đó xuất hiện mọi từ được chỉ định trong truy vấn, hãy đặt dấu cộng "+" trước mỗi từ đó. Ngược lại, nếu bạn muốn loại trừ bất kỳ từ nào khỏi kết quả tìm kiếm, hãy đặt dấu trừ "-" trước từ này. Các dấu "+" và "-" phải được viết với khoảng trắng từ dấu trước và được ghép với từ tiếp theo. Ví dụ: truy vấn "Volga-car" sẽ tìm các tài liệu có chứa từ "Volga" chứ không phải từ "car".

7. Khi tìm kiếm từ đồng nghĩa hoặc từ gần nghĩa, bạn có thể đặt một thanh dọc "|" giữa các từ. Ví dụ, đối với truy vấn "con | đứa trẻ | baby "sẽ tìm tài liệu có bất kỳ từ nào trong số này.

8. Thay vì một từ trong một truy vấn, bạn có thể thay thế toàn bộ một biểu thức. Để làm điều này, nó phải được đặt trong dấu ngoặc vuông, ví dụ "(child | baby | children | baby) + (care | upbringing)".

9. Ký tự * ~ "(dấu ngã) cho phép bạn tìm tài liệu có câu chứa từ đầu tiên, nhưng không chứa từ thứ hai. Ví dụ, tìm kiếm "books ~ shop" sẽ tìm thấy tất cả các tài liệu có chứa từ "books" mà không có từ "shop" bên cạnh nó (trong câu).

10. Nếu toán tử được lặp lại một lần (ví dụ, & hoặc ~), thì việc tìm kiếm sẽ được thực hiện trong câu. Toán tử kép (&&, -) tìm kiếm trong tài liệu. Ví dụ, truy vấn "ung thư - chiêm tinh học" sẽ tìm thấy các tài liệu có từ "ung thư" không liên quan đến chiêm tinh học.

Bạn có thể sử dụng tìm kiếm nâng cao để có một tập hợp các thuật ngữ phổ biến nhất trong khu vực mong muốn. Trên hình. 3.3 hiển thị cửa sổ tìm kiếm nâng cao trong công cụ tìm kiếm Yandex. Trong chế độ này, các khả năng của ngôn ngữ truy vấn được triển khai dưới dạng biểu mẫu. Một dịch vụ tương tự, bao gồm bộ lọc từ điển, được cung cấp bởi hầu hết các công cụ tìm kiếm.

Cơm. 3.3. Ví dụ về tìm kiếm nâng cao trong hệ thống Yandex

Với sự lựa chọn chính xác các từ mong muốn và bắt buộc cũng như loại trừ các cụm từ không mong muốn, việc tìm kiếm như vậy có thể cho kết quả tốt.

Hãy quay lại với ví dụ về cá cảnh. Sau khi đọc một số tài liệu được cung cấp bởi công cụ tìm kiếm, rõ ràng rằng việc tìm kiếm thông tin trên Internet không nên bắt đầu bằng việc lựa chọn cá cảnh. Bể cá là một hệ thống sinh học phức tạp, việc tạo ra và duy trì chúng đòi hỏi kiến ​​thức đặc biệt, thời gian và sự đầu tư nghiêm túc.

Dựa trên thông tin nhận được, một người thực hiện tìm kiếm trên Internet có thể thay đổi hoàn toàn chiến lược tìm kiếm thêm, quyết định nghiên cứu tài liệu đặc biệt liên quan đến vấn đề đang nghiên cứu.

Để tìm kiếm tài liệu văn học hoặc tài liệu toàn văn, có thể thực hiện truy vấn sau:

"+ (hồ cá | người chơi thủy sinh | người chơi thủy sinh) + cho người mới bắt đầu + (lời khuyên | tài liệu) + (bài báo | luận án | toàn văn) - (giá cả | cửa hàng | giao hàng | danh mục)".

Sau khi xử lý yêu cầu của công cụ tìm kiếm, kết quả sau thu được: trang - 195, trang - ít nhất 43.

Có thể thấy qua thống kê tìm kiếm, kết quả rất thành công. Các liên kết đầu tiên đã dẫn đến các tài liệu được yêu cầu:

Thiết lập hồ cá> Mẹo cho người mới bắt đầu chơi thủy sinh>
Các bài báo> Aq uascope. en
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - tuân thủ nghiêm ngặt.
TƯ VẤN ĐỂ BẮT ĐẦU THỦY SẢN. Làm thế nào để chọn và lắp đặt một bể cá, làm thế nào để ...
http://www.aquariums.ru/sovna.htm (2KB) 23/07/2002 - thư từ không nghiêm ngặt.

Giờ đây, bạn có thể tóm tắt kết quả tìm kiếm, rút ​​ra một số kết luận nhất định và quyết định các hành động có thể thực hiện:

♦ Hãy dừng việc tìm kiếm thêm, vì nhiều lý do khác nhau, việc bảo trì bể cá nằm ngoài khả năng của bạn.
♦ Đọc các bài báo gợi ý và bắt đầu thiết lập một bể cá.
♦ Tìm kiếm tài liệu về chuột đồng hoặc chuột đồng.

Tìm kiếm Chuyên nghiệp

Các nhà nghiên cứu và chuyên gia sẽ phải có cách tiếp cận chu đáo hơn đối với việc tổ chức tìm kiếm. Khi tìm kiếm thông tin trên Internet một cách chuyên nghiệp, các yêu cầu sau phải được đáp ứng:

♦ tốc độ tìm kiếm cao;
♦ độ tin cậy của thông tin nhận được;
♦ tính đầy đủ của phạm vi bảo hiểm của các nguồn lực trong quá trình tìm kiếm.

Tốc độ. Tốc độ tìm kiếm chủ yếu phụ thuộc vào hai yếu tố: vào việc lập kế hoạch tìm kiếm có năng lực (lựa chọn dịch vụ và công cụ tìm kiếm) và kỹ năng làm việc với tài nguyên đã được chọn (khả năng hiểu nhanh cấu trúc và phương pháp điều hướng của nó). Các chỉ mục tìm kiếm không đủ để đảm bảo tốc độ tìm kiếm. Ngoài chúng, có một số tài nguyên tìm kiếm trên Internet, việc sử dụng chúng đảm bảo hiệu suất của một tìm kiếm chuyên nghiệp.

Độ tin cậy. Câu hỏi về độ tin cậy của thông tin nhận được từ Internet là rất phù hợp, vì bất kỳ ai cũng có thể đặt bất kỳ thông tin nào ở đó mà không có bất kỳ sự kiểm soát nào đối với việc tuân thủ thực tế của nó. Do đó, điều này dẫn đến một số lượng lớn các nguồn không đáng tin cậy, chẳng hạn như tóm tắt và các bài báo học kỳ đã tràn ngập trên Internet.

Có những dịch vụ tìm kiếm đặc biệt cho phép bạn đánh giá độ tin cậy của một nguồn thông tin trên Internet.

Tính hoàn chỉnh. Điều kiện cần thiết để thu thập thông tin quy mô đầy đủ thành công là kiến ​​thức về các loại tài nguyên chính tồn tại ngày nay và việc sử dụng các dịch vụ tìm kiếm khác nhau. Không có công cụ tìm kiếm nào có thể bao quát tất cả các tài nguyên của Internet.

Theo quy luật, để đạt được một kết quả tích cực, người dùng phải sử dụng các dịch vụ của một số công cụ tìm kiếm. Bạn có thể tự làm việc đó, chuyển từ hệ thống này sang hệ thống khác hoặc bạn có thể giao công việc này cho một trong các công cụ metasearch (meta là thành phần đầu tiên của các từ ghép biểu thị các hệ thống để mô tả và nghiên cứu các hệ thống khác).

Cơm. 3.4. Cửa sổ Metasearch

Công cụ Metasearch không có cơ sở dữ liệu tìm kiếm riêng và sử dụng tài nguyên của nhiều công cụ tìm kiếm khác khi tìm kiếm. Do đó, xác suất tìm thấy thông tin cần thiết là rất cao. Công việc trong hệ thống metasearch được thực hiện theo các quy tắc tương tự như công việc trong các công cụ tìm kiếm. Điều này là do các công cụ metasearch là một loại tiện ích bổ sung cho các công cụ tìm kiếm và sử dụng cơ sở dữ liệu chỉ mục của chúng trong công việc. Sự xuất hiện của các công cụ metasearch giống với sự xuất hiện của các công cụ tìm kiếm nổi tiếng. Trên hình. 3.4 hiển thị các cửa sổ của công cụ metasearch myweb.ru và metabot.ru.

Kinh nghiệm cho thấy rằng trong hầu hết các trường hợp, kết quả tốt hơn đạt được khi sử dụng một số chỉ mục tìm kiếm độc lập hơn là sử dụng một công cụ metasearch.

Kiểm soát câu hỏi và nhiệm vụ

1. Mục đích của một chương trình trình duyệt là gì?

2. Bạn biết những chương trình trình duyệt nào?

3. Người dùng lập kế hoạch tìm kiếm trên Internet có thể tìm thấy URL ở đâu?

4. Công nghệ tìm kiếm cho điểm đánh giá của công cụ tìm kiếm là gì?

5. Công nghệ tìm kiếm từ khóa là gì?

6. Những yêu cầu nào phải được tuân thủ trong việc tìm kiếm thông tin trên Internet một cách chuyên nghiệp?

7. Khi nào bạn cần chỉ định các dấu "+" hoặc "-" trong tiêu chí tìm kiếm?

8. Tiêu chí tìm kiếm nào trong Yandex được đặt bởi cụm từ sau:

(vú em | giáo viên | gia sư) ++ (chăm sóc | nuôi dạy | giám sát).

9. Nhân đôi dấu (∼∼ hoặc ++) có nghĩa là gì khi tạo một truy vấn phức tạp?

10. Mức độ liên quan của tìm kiếm là gì?

11. Mục đích của động cơ metasearch là gì?

Chủ đề 1.1
Công cụ tìm kiếm. Tổ chức tìm kiếm

TỪ Ngày nay, Internet kết hợp nhiều mạng khác nhau, hàng triệu máy tính, hơn 300 triệu người dùng trên khắp các châu lục, và theo nhiều ước tính khác nhau, số lượng người dùng như vậy đang tăng 15-80% hàng năm. Internet cung cấp khả năng truy cập nhanh chóng vào lượng thông tin khổng lồ về bất kỳ chủ đề nào, giúp tìm kiếm và tương tác với các đối tác trong hầu hết các chuyên ngành và ở bất kỳ khu vực nào trên toàn cầu. Người dùng có nhu cầu tìm kiếm thông tin về bất kỳ vấn đề nào. Theo ngôn ngữ của lý thuyết truy xuất thông tin, điều này được gọi là nhu cầu thông tin . Internet cung cấp một cơ hội như vậy.

Internet như một kho lưu trữ thông tin rất thú vị đối với các tài liệu được tích lũy qua nhiều thập kỷ tồn tại của nó. Làm thế nào để điều hướng trong một không gian thông tin khổng lồ mà Internet cung cấp cho chúng ta?

Khi giải quyết vấn đề này, các công cụ tìm kiếm sẽ đến giải cứu. Công cụ tìm kiếm (PI) là phần mềm đặc biệt có nhiệm vụ chính là cung cấp khả năng tìm kiếm thông tin trên Internet một cách tối ưu. Các IP được lưu trữ trên các máy chủ chuyên dụng và mỗi IP thực hiện bốn nhiệm vụ chính sau:

1) phân tích các trang Web;

2) nhập kết quả phân tích các trang Web trên một hoặc một cấp khác của cơ sở dữ liệu máy chủ tìm kiếm, tùy thuộc vào phương pháp lập chỉ mục tự động, tức là các phương pháp phân tích nội dung trang;

3) tìm kiếm tài liệu theo yêu cầu của người sử dụng;

4) cung cấp giao diện thân thiện với người dùng để người dùng tìm kiếm thông tin và xem kết quả tìm kiếm.

Các phương pháp làm việc được sử dụng khi làm việc với các công cụ tìm kiếm khác nhau gần như giống nhau, trong khi các khái niệm sau được sử dụng:

Giao diện người dùng của công cụ tìm kiếm được trình bày dưới dạng một trang HTML với các liên kết URL được kích hoạt, một chuỗi truy vấn (chuỗi tìm kiếm) và các công cụ kích hoạt truy vấn;

Chỉ mục công cụ tìm kiếm - kết quả phân tích các trang Web, được đặt trong cơ sở dữ liệu của máy chủ tìm kiếm theo các quy tắc nhất định;

Truy vấn - một cụm từ hoặc các từ khóa do người dùng nhập vào thanh tìm kiếm. Các ký tự đặc biệt (&&, ||, "", ~), ký hiệu toán học (*, +, -), toán tử boolean (và, hoặc, không, gần) được sử dụng để tạo truy vấn.

Để giải thích cho dịch vụ tìm kiếm những gì nó cần tìm, người dùng buộc phải chính thức hóa nhu cầu thông tin của mình theo một cách nào đó. Quá trình chính thức hóa, như một quy luật, đi đến việc xác định một tập hợp các khái niệm và thuật ngữ đặc trưng cho nhu cầu thông tin, và xác định mối quan hệ giữa chúng. Các khái niệm và thuật ngữ như vậy được gọi là từ khóa và tập hợp các từ khóa đã chọn có mối quan hệ cố định giữa chúng được gọi là yêu cầu.

Người dùng, bằng cách gõ từ khóa và kích hoạt tìm kiếm, sẽ nhận được một danh sách các tài liệu theo yêu cầu đã lập (cho sẵn). Danh sách các tài liệu được chọn bởi hệ thống truy xuất thông tin thường được gọi là dẫn độ hoặc phản ứng và thước đo sự tuân thủ của phản hồi với một yêu cầu hoặc nhu cầu thông tin - sự liên quan phản ứng. Danh sách này được xếp hạng theo các tiêu chí nhất định để ở đầu danh sách là những tài liệu phù hợp nhất với truy vấn của người dùng. Mỗi công cụ tìm kiếm sử dụng các tiêu chí khác nhau để xếp hạng tài liệu, cả trong phân tích kết quả tìm kiếm và hình thành chỉ mục (điền vào cơ sở dữ liệu chỉ mục của các trang Web). Kết quả là, nếu bạn nhập cùng một cấu trúc truy vấn vào thanh tìm kiếm cho mỗi công cụ tìm kiếm, bạn sẽ nhận được các kết quả tìm kiếm khác nhau.

Có bốn đặc điểm chính cho kết quả tìm kiếm trên Internet:

sự đầy đủ;

Sự chính xác;

Sự phù hợp;

Tốc độ nhận.

Mỗi đặc điểm này bị ảnh hưởng bởi một số yếu tố mà người dùng cần lưu ý khi bắt đầu tìm kiếm. Một số trong số đó là khách quan, tức là người dùng không thể ảnh hưởng đến họ. Tuy nhiên, có ba yếu tố chính mà người dùng phải xem xét khi thực hiện các thao tác tìm kiếm. Bao gồm các:

1) lựa chọn không gian truy xuất thông tin trong mạng;

2) các tính năng của hệ thống truy xuất thông tin;

3) chất lượng của việc xây dựng truy vấn.

Mỗi công cụ tìm kiếm cung cấp hai cách để tìm kiếm, giản dị(Tìm kiếm đơn giản) và mở rộng(Tìm kiếm nâng cao), trong trường hợp thứ hai - sử dụng biểu mẫu yêu cầu đặc biệt, trong trường hợp đầu tiên - không có biểu mẫu này.

Bằng cách nắm vững các tiêu chí sàng lọc truy vấn và các kỹ thuật tìm kiếm nâng cao, bạn có thể tăng hiệu quả tìm kiếm của mình và nhanh chóng tìm thấy thông tin bạn cần. Trước hết, bạn có thể tăng hiệu quả tìm kiếm bằng cách sử dụng các toán tử logic (phép toán) trong các truy vấn hoặc (hoặc), , nea r ( gần) không t ( không phải), các ký hiệu toán học và đặc biệt. Với sự trợ giúp của toán tử và / hoặc và ký hiệu, người dùng kết nối các từ khóa theo trình tự mong muốn để có được kết quả tìm kiếm thích hợp nhất cho truy vấn.

Dưới đây là các bảng với các ví dụ về cách sử dụng các truy vấn đơn giản và nâng cao bằng cách sử dụng toán tử boolean:

Yêu cầu đơn giản
giáo dục
giáo dục *
giáo dục đại học
"giáo dục đại học"

Ví dụ thứ hai sử dụng ký tự dấu hoa thị. Điều này có nghĩa là tất cả các tài liệu đều được tìm kiếm cho mặt nạ này, tức là tất cả các hình thành từ từ "giáo dục" và bản thân từ này trong các trường hợp khác nhau.

Trong ví dụ thứ ba, các từ khóa được viết đơn giản, vì vậy trong danh sách các tài liệu được cấp cho một yêu cầu như vậy, các từ khác, liên từ, v.v. có thể nằm giữa các từ khóa này.

Trong ví dụ cuối cùng, việc sử dụng dấu ngoặc kép - "giáo dục đại học" có nghĩa là tìm kiếm toàn bộ cụm từ.

Một truy vấn đơn giản cung cấp một số lượng đáng kể các liên kết đến tài liệu, bởi vì danh sách bao gồm các tài liệu có chứa một trong các từ được nhập theo yêu cầu hoặc một cụm từ đơn giản.

Truy vấn nâng cao sử dụng toán tử boolean.

Nhà điều hành cho phép bạn chỉ định rằng tất cả các từ khóa nên được đưa vào nội dung của tài liệu. Tuy nhiên, số lượng tài liệu có thể vẫn còn nhiều và có thể mất nhiều thời gian để xem xét chúng. Do đó, trong một số trường hợp, sử dụng toán tử ngữ cảnh sẽ thuận tiện hơn nhiều gần, chỉ ra rằng các từ nên được đặt gần nhau trong tài liệu. Sử dụng gần sẽ giảm đáng kể số lượng tài liệu được tìm thấy.

Khi hình thành một truy vấn, bạn có thể sử dụng các ký hiệu toán học. “Dấu cộng” (+) trước bất kỳ từ truy vấn nào sẽ buộc công cụ tìm kiếm phải tính đến từ này khi xử lý truy vấn. "Trừ" (-) tương ứng với toán tử ( KHÔNG PHẢI) và hoạt động để loại trừ cụm từ khỏi kết quả. Vì vậy, nhà điều hành KHÔNG PHẢI- phương tiện đầu tiên để làm rõ các truy vấn quá rộng. Các dấu (+ và -) được đặt trong truy vấn trước từ mong muốn, trong khi chúng không được ngăn cách với từ đó bằng dấu cách.

Một cách khác để thu hẹp phạm vi tìm kiếm của bạn là sử dụng đặc biệt từ khóa. Các từ khóa được viết đặc biệt được hiển thị trong bảng sau. Tuy nhiên, chúng phải được sử dụng rất cẩn thận, vì không phải tất cả các công cụ tìm kiếm đều hỗ trợ tìm kiếm các từ khóa được liệt kê. Để đảm bảo từ khóa nào được hỗ trợ bởi một công cụ tìm kiếm nhất định, bạn nên xem thông tin trợ giúp hoặc siêu liên kết của nó Giúp đỡ.

chủ nhà:<адрес_узла> Trả về danh sách tài liệu từ các nút có tên chứa giá trị được nhập trong tham số<адрес_узла>. Ví dụ, máy chủ yêu cầu: www.skags.ru sẽ nhận được danh sách các tài liệu nằm trên máy chủ có địa chỉ là www.skags.ru (Hình 1.1)
url:<текст> Tìm các trang có chứa một từ hoặc cụm từ cụ thể trong địa chỉ của chúng. Bằng cách chỉ định url: Microsoft, bạn sẽ tìm thấy tất cả các trang có địa chỉ (URL) chứa từ Microsoft (Hình 1.2)
liên kết: Tìm tài liệu có liên kết đến URL được chỉ định. Liên kết yêu cầu: altavista.com sẽ giúp bạn tìm tất cả các trang có chứa liên kết đến AltaVista (Hình 1.3)
hình ảnh<текст> Tìm tài liệu có hình ảnh có tiêu đề hoặc mô tả bao gồm từ được nhập làm tham số văn bản. Ví dụ: đối với hình ảnh yêu cầu Nga, chúng tôi sẽ nhận được danh sách địa chỉ của các tài liệu có chứa hình ảnh, tên hoặc mô tả trong đó bao gồm từ Nga (Hình 1.4)
chức vụ<текст> Tìm tài liệu có tiêu đề bao gồm cụm từ được chỉ định (có nghĩa là tiêu đề của tài liệu xuất hiện trong thanh tiêu đề khi tài liệu được mở trong trình duyệt). Tiêu đề truy vấn Windows 7 sẽ giúp bạn tìm các trang có từ Windows 7 trong tiêu đề.

Ví dụ về việc sử dụng các từ khóa đặc biệt trong các công cụ tìm kiếm khác nhau được đưa ra dưới đây.

Hình.1.1. chủ nhà

Hình.1.2. Sử dụng một từ khóa đặc biệt url

Hình 1.3. Sử dụng một từ khóa đặc biệt liên kết

Hình 1.4. Sử dụng một từ khóa đặc biệt hình ảnh

Hình 1.5. Sử dụng một từ khóa đặc biệt chức vụ

Chủ đề 1.2
Máy chủ tìm kiếm

Con đường dẫn đến hành trang thông tin khổng lồ của nhân loại, được lưu trữ trong các thư viện, thư viện âm nhạc, thư viện phim, nằm thông qua các thẻ danh mục. Trên Internet, có những cơ chế tương tự để tìm kiếm thông tin cần thiết. Đây là những công cụ tìm kiếm đóng vai trò là điểm khởi đầu cho người dùng web. Máy chủ tìm kiếm có thể được chia thành các chuyên đề danh mục(thư mục tìm kiếm), rô bốt chỉ mục(công cụ tìm kiếm hoặc công cụ tìm kiếm), hệ thống meta tìm kiếm.

Danh mục chuyên đề của Internet tương tự như thư viện, thông tin trong đó có cấu trúc thứ bậc, phân loại theo chủ đề bao gồm tất cả các lĩnh vực hoạt động của con người: nghệ thuật, khoa học, giáo dục, v.v. Danh mục được sử dụng khi họ không hoàn toàn biết rõ họ đang tìm kiếm gì, khi chủ đề được phác thảo, nhưng tìm kiếm không được chỉ định. Vào bất kỳ phần nào, người dùng sẽ thấy được nhiều hơn và chi tiết hơn. Tại đây bạn cũng có thể tìm kiếm thông tin theo từ khóa.

Danh mục đã phát sinh từ các liên kết thú vị, dấu trang. Chúng được xây dựng trên nguyên tắc từ chung đến riêng. Thư mục có thể là:

1) mục đích chung (bao gồm các nguồn lực của tất cả các lĩnh vực của cuộc sống con người);

2) chuyên biệt (kết hợp các nguồn lực dành riêng cho một chủ đề cụ thể).

Việc lập danh mục được tự động hóa một phần, nhưng việc phân loại tài nguyên vẫn được thực hiện thủ công. Danh mục không tự cập nhật.

Theo ý kiến ​​của chúng tôi, hãy xem xét các thư mục tìm kiếm phổ biến nhất: tiếng Nga và toàn cầu. Dưới đây là tên của các thư mục và địa chỉ Internet của chúng.

Xem xét các công cụ tìm kiếm và các tính năng của chúng. Các hệ thống này còn được gọi là rô bốt chỉ mục hoặc công cụ tìm kiếm.

Công cụ tìm kiếm được tổ chức hơi khác một chút so với thư mục tìm kiếm. Trên thực tế, đây là một máy chủ có cơ sở dữ liệu khổng lồ gồm các URL tự động truy cập các trang WWW tại tất cả các địa chỉ này, kiểm tra nội dung của các trang này, tạo và ghi từ khóa từ các trang vào cơ sở dữ liệu của nó (lập chỉ mục các trang). Hơn nữa, máy chủ này truy cập vào tất cả các liên kết gặp phải trên các trang và chuyển sang các trang mới cũng làm như vậy với chúng. Tất cả các liên kết được đặt trong cơ sở dữ liệu. Người dùng sử dụng các từ khóa mà công cụ tìm kiếm tra cứu trong cơ sở dữ liệu. Việc phát hành kết quả tìm kiếm bao gồm các đoạn trích của các trang được giới thiệu cho người dùng, địa chỉ của họ (URL), được sắp xếp dưới dạng siêu liên kết.

Trong trường hợp của các công cụ tìm kiếm, một lượng lớn thông tin được xử lý tự động. Các công cụ tìm kiếm có xu hướng tự cập nhật.

Hãy xem xét các công cụ tìm kiếm phổ biến nhất theo quan điểm của chúng tôi: tiếng Nga và toàn cầu. Tất nhiên, có nhiều công cụ tìm kiếm hơn trên Internet, nhưng, theo ý kiến ​​của chúng tôi, những công cụ được trình bày là phổ biến nhất và đang có nhu cầu.

Chủ đề 1.3
Tìm kiếm thông tin trên Internet

Các chiến lược được sử dụng để tìm kiếm thông tin trên Internet không ngừng được cải tiến. Tìm kiếm web nó phần lớn là một nghệ thuật dựa trên kiến ​​thức về bản thân web, khả năng của các công cụ tìm kiếm và ở mức độ thấp hơn nhiều, khả năng của một trình duyệt cụ thể. Theo quy tắc, các trình duyệt có một bảng điều khiển mà bạn có thể thực hiện các chức năng tìm kiếm trong đó web.

Ưu điểm của bảng điều khiển như vậy là bạn có thể truy vấn nhiều máy chủ từ một trang, giúp bạn tiết kiệm rất nhiều thời gian vì bạn không phải tải lần lượt các trang tiêu đề của các công cụ tìm kiếm này. Những công cụ cung cấp quyền truy cập vào một số công cụ tìm kiếm cùng một lúc được gọi là công cụ tìm kiếm meta.

Thật không may, các công cụ tìm kiếm meta như vậy không có nghĩa là không có thiếu sót. Điều chính là tìm kiếm meta trên các máy chủ được hỗ trợ được thực hiện theo phương pháp đơn giản hóa nhất (Tìm kiếm đơn giản). Điều này là do mỗi công cụ tìm kiếm có bộ tùy chọn bổ sung riêng để thu hẹp khu vực tìm kiếm, sử dụng toán tử Boolean, v.v. Đương nhiên, trong trường hợp “tìm kiếm” đơn giản (Tìm kiếm đơn giản), các tài liệu có thể được tìm thấy trong quá trình tìm kiếm kỹ lưỡng hơn với các công cụ nâng cao cho một máy chủ cụ thể.