Một chương trình tìm kiếm tập tin media trên máy tính của bạn. Phần mềm và dịch vụ tìm kiếm chuyên nghiệp

Công cụ tìm kiếm là cơ sở dữ liệu về thông tin cụ thể trên Internet. Nhiều người dùng tin rằng ngay khi họ nhập truy vấn vào công cụ tìm kiếm, toàn bộ Internet sẽ được thu thập thông tin ngay lập tức, nhưng điều này hoàn toàn không đúng. Internet được quét liên tục bởi nhiều chương trình, dữ liệu về các trang web được nhập vào cơ sở dữ liệu, trong đó, theo các tiêu chí nhất định, tất cả các trang web và tất cả các trang của chúng được phân bổ thành nhiều loại danh sách và cơ sở dữ liệu khác nhau. Tức là nó là một loại tủ đựng hồ sơ chứa dữ liệu và việc tìm kiếm không diễn ra trên Internet mà diễn ra trên tủ hồ sơ này.

Google là công cụ tìm kiếm phổ biến nhất trên thế giới.

Ngoài công cụ tìm kiếm, Google còn cung cấp nhiều dịch vụ, chương trình và phần cứng bổ sung, bao gồm dịch vụ email, trình duyệt Google Chrome, thư viện video lớn nhất YouTube và nhiều dự án khác. Google đang tự tin mua lại nhiều dự án mang lại lợi nhuận lớn. Hầu hết các dịch vụ không nhắm đến người dùng trực tiếp mà nhằm kiếm tiền trên Internet và được tích hợp tập trung vào lợi ích của người dùng Châu Âu và Châu Mỹ.

Mail là một công cụ tìm kiếm phổ biến chủ yếu nhờ dịch vụ email của nó.

Có nhiều dịch vụ bổ sung, trong đó chủ yếu là Mail, hiện tại công ty Mail sở hữu mạng xã hội Odnoklassniki, mạng riêng “My World”, dịch vụ Money-mail, nhiều trò chơi trực tuyến, ba trình duyệt gần như giống hệt nhau với các tên khác nhau . Tất cả các ứng dụng và dịch vụ đều chứa rất nhiều nội dung quảng cáo. Mạng xã hội VKonatkte chặn chuyển đổi trực tiếp sang các dịch vụ Thư, biện minh cho chúng có số lượng lớn vi-rút.

Wikipedia.

Wikipedia là một hệ thống tham khảo tìm kiếm.

Do đó, công cụ tìm kiếm phi lợi nhuận hoạt động dựa trên sự đóng góp của cá nhân nên không lấp đầy các trang của nó bằng quảng cáo. Một dự án đa ngôn ngữ với mục tiêu là tạo ra một bộ bách khoa toàn thư tham khảo đầy đủ bằng tất cả các ngôn ngữ trên thế giới. Nó không có tác giả cụ thể và được các tình nguyện viên từ khắp nơi trên thế giới thực hiện và điều hành. Mỗi người dùng có thể vừa viết vừa chỉnh sửa một bài viết.

Trang chính thức - www.wikipedia.org.

Youtube là thư viện file video lớn nhất.

Lưu trữ video với các thành phần của mạng xã hội, nơi mỗi người dùng có thể thêm video. Kể từ khi được Google Ink mua lại, không cần phải đăng ký riêng cho YouTube, chỉ cần đăng ký dịch vụ email của Google.

Trang chính thức - youtube.com.

Yahoo! là công cụ tìm kiếm quan trọng thứ hai trên thế giới.

Có các dịch vụ bổ sung, trong đó nổi tiếng nhất là Yahoo mail. Là một phần trong việc cải thiện chất lượng của công cụ tìm kiếm, Yahoo chuyển dữ liệu về người dùng và các truy vấn của họ cho Microsoft. Từ dữ liệu này, ý tưởng về lợi ích của người dùng được hình thành và thị trường cho nội dung quảng cáo được hình thành. Công cụ tìm kiếm Yahoo, như , đang tham gia vào việc mua lại các công ty khác, chẳng hạn như Yahoo sở hữu dịch vụ tìm kiếm Altavista và trang thương mại điện tử Alibaba.

Trang chính thức - www.yahoo.com.

WDL là một thư viện kỹ thuật số.

Thư viện thu thập những cuốn sách mang lại giá trị văn hóa ở dạng kỹ thuật số. Mục tiêu chính là nâng cao mức độ nội dung văn hóa của Internet. Truy cập vào thư viện là miễn phí.

Trang chính thức - www.wdl.org/ru/.

Bing là một công cụ tìm kiếm của Microsoft.

Trang chính thức - www.baidu.com.

Công cụ tìm kiếm ở Nga

Rambler là một công cụ tìm kiếm “thân Mỹ”.

Ban đầu nó được tạo ra như một cổng truyền thông Internet. Giống như nhiều công cụ tìm kiếm khác, nó có các dịch vụ tìm kiếm hình ảnh, tệp video, bản đồ, dự báo thời tiết, phần tin tức và nhiều hơn thế nữa. Các nhà xuất bản cũng cung cấp một trình duyệt miễn phí, Rambler-Nichrome.

Trang chính thức - www.rambler.ru.

Nigma là một công cụ tìm kiếm thông minh.

Công cụ tìm kiếm thuận tiện hơn do có nhiều bộ lọc và cài đặt. Giao diện cho phép bạn bao gồm hoặc loại trừ các giá trị tương tự được đề xuất trong tìm kiếm để thu được kết quả tốt hơn. Ngoài ra, khi nhận được kết quả tìm kiếm, nó cho phép bạn sử dụng thông tin từ các công cụ tìm kiếm lớn khác.

Trang chính thức - www.nigma.ru.

Aport - danh mục sản phẩm trực tuyến.

Trước đây là một công cụ tìm kiếm nhưng sau khi ngừng phát triển và đổi mới, nó nhanh chóng mất đi chỗ đứng và . Hiện tại, Aport là sàn giao dịch nơi giới thiệu sản phẩm của hơn 1.500 công ty.

Trang chính thức - www.aport.ru.

Sputnik là một công cụ tìm kiếm quốc gia và cổng Internet.

Được tạo bởi Rostelecom. Hiện đang trong giai đoạn thử nghiệm.

Trang chính thức - www.sputnik.ru.

Metabot là một công cụ tìm kiếm đang phát triển.

Nhiệm vụ của Metabot là tạo một công cụ tìm kiếm cho tất cả các công cụ tìm kiếm khác, tạo ra các vị trí kết quả có tính đến dữ liệu từ toàn bộ danh sách các công cụ tìm kiếm. Tức là nó là một công cụ tìm kiếm cho các công cụ tìm kiếm.

Trang chính thức - www.metabot.ru.

Công cụ tìm kiếm đã bị đình chỉ.

Trang chính thức - www.turtle.ru.

KM là một cổng đa cổng.

Ban đầu, trang web này là một trang đa cổng với sự ra đời sau đó của công cụ tìm kiếm. Việc tìm kiếm có thể được thực hiện cả trong trang web và trên tất cả các trang RuNet được giám sát.

Trang chính thức - www.km.ru.

Gogo - không hoạt động, chuyển hướng đến công cụ tìm kiếm.

Trang chính thức - www.gogo.ru.

Hệ thống đa cổng của Nga, vốn không phổ biến lắm, cần được cải thiện. Công cụ tìm kiếm bao gồm tin tức, truyền hình, trò chơi và bản đồ.

Trang chính thức - www.zoneru.org.

Công cụ tìm kiếm không hoạt động, các nhà phát triển khuyên bạn nên sử dụng công cụ tìm kiếm.

Một chương trình tìm kiếm nhanh các tệp trong các thư mục được chỉ định theo tên tệp và nội dung của nó. Điều khác biệt giữa Windows với chức năng tìm kiếm tiêu chuẩn là tốc độ và hiệu quả cao cũng như khả năng tìm thấy tệp ngay cả trong kho lưu trữ!

Thư viện ảnh chụp màn hình

Làm việc trên máy tính, bằng cách này hay cách khác, liên quan đến việc xử lý nhiều loại dữ liệu văn bản. Cho dù chúng ta đang tìm kiếm thông tin trên Internet, viết báo cáo thường niên hay chỉ đọc sách, chúng ta đều bắt gặp văn bản ở mọi nơi chúng ta đến!

Chúng tôi thường biết tất cả các tệp công việc của mình nằm ở đâu vì chúng tôi mở chúng hầu như hàng ngày. Nhưng đôi khi có những tình huống chúng ta nhớ ra rằng ở đâu đó chúng ta có một tài liệu với những thông tin cần thiết nhưng lại quên mất nó ở đâu và tên nó là gì.

Chúng tôi có hai tùy chọn: chúng tôi có thể cố gắng tìm tệp mình cần theo cách thủ công bằng cách mở và kiểm tra tất cả các thư mục đang làm việc hoặc chúng tôi có thể sử dụng tính năng Windows để tìm kiếm một từ hoặc cụm từ.

Tuy nhiên, nếu chúng ta có nhiều thư mục và tệp, thì việc tìm kiếm thủ công mọi thứ gần như là không thể và công cụ tìm kiếm tích hợp chỉ có thể tìm kiếm bên trong các tệp văn bản thông thường (tuy nhiên, Windows 7 đã có thể tìm kiếm trong DOC).

Trong trường hợp này, chỉ phần mềm của bên thứ ba có khả năng tìm kiếm nâng cao mới có thể giúp chúng tôi. Tất cả các chương trình thuộc loại này có thể được chia thành hai loại: những chương trình sử dụng cơ chế lập chỉ mục và những chương trình không sử dụng cơ chế lập chỉ mục.

Trên thực tế, những ứng dụng không sử dụng tính năng lập chỉ mục khi quét sẽ kiểm tra tất cả các tệp mỗi lần để tìm sự hiện diện của chuỗi tìm kiếm, nghĩa là chúng tự động thực hiện một cơ chế tương tự như tìm kiếm thủ công.

Tốc độ tăng lên so với một công cụ tìm kiếm tiêu chuẩn chủ yếu là do khả năng song song hóa tốt hơn các yêu cầu đối với hệ thống tệp, tuy nhiên, việc này có thể mất khá nhiều thời gian.

Nguyên tắc lập chỉ mục các tệp trên PC cục bộ về cơ bản giống như trên Internet. Chương trình quét trước ổ đĩa hoặc thư mục được chỉ định và tạo cơ sở dữ liệu gồm các tệp có khả năng phát hiện nhanh nội dung của chúng. Do đó, việc tìm kiếm diễn ra chỉ trong vài giây!

Nhược điểm của loại chương trình này là ưu điểm của chúng - cần phải lập chỉ mục các tệp, mất khá nhiều thời gian :(. Mặt khác, theo tôi, loại chương trình này tốt hơn và có nhiều chức năng hơn so với các chương trình tương tự hoạt động mà không có chỉ mục, vì vậy tôi khuyên bạn nên làm quen với một trong những chương trình miễn phí tốt nhất thuộc loại này - Trình tải tài liệu.

Ngày nay có khá nhiều chương trình lập chỉ mục và tìm kiếm tệp cục bộ, nhưng không phải tất cả chúng đều có khả năng giống nhau. Về bề rộng chức năng, DocFetcher có thể được so sánh với hệ thống lập chỉ mục trả phí phổ biến Archivarius 3000.

So sánh với một chất tương tự trả phí

Từ sự so sánh, rõ ràng là các chương trình khác nhau rất ít (có lẽ ngoại trừ giao diện). Cả hai chương trình đều hoạt động với hầu hết tất cả các loại tệp và cả hai đều cho phép bạn sử dụng các truy vấn phức tạp có chứa mặt nạ tìm kiếm.

Ưu điểm duy nhất của Archivist là nó sử dụng cơ sở dữ liệu liên tục để lập chỉ mục, cho phép bạn xem nội dung của các thư mục từ xa và phương tiện di động hiện không thể truy cập được.

Mặc dù việc DocFetcher sử dụng cơ sở dữ liệu động không phải là một điểm trừ vì nó tự động lập chỉ mục các tệp đã thêm và đã xóa, điều này cho phép bạn luôn có sẵn phiên bản cập nhật nhất của danh sách tất cả các tệp đang làm việc.

Chuẩn bị làm việc với chương trình

Một ưu điểm nữa của DocFetcher là sự hiện diện của phiên bản di động, được chính các nhà phát triển khuyến nghị sử dụng (mặc dù nó cũng có sẵn). Các nhà phát triển khuyên bạn nên sử dụng phiên bản di động vì hai lý do:

  1. Phiên bản di động có thể chạy trên tất cả các hệ thống phổ biến vì nó được viết bằng ngôn ngữ JAVA độc lập với nền tảng và chứa các tệp thực thi của tất cả các hệ điều hành phổ biến hiện nay (Windows, UNIX và Mac OS).
  2. Nếu bạn quen mang theo tất cả các tệp công việc của mình trên ổ đĩa flash hoặc ổ cứng ngoài, thì phiên bản di động có thể lập chỉ mục các tệp ngay cả trên thiết bị di động, điều này sẽ cho phép bạn tìm thấy các tệp bạn cần nhanh chóng như trên một thiết bị di động. MÁY TÍNH. Một lần nữa, ổ đĩa flash có thể được kết nối với bất kỳ máy tính nào có bất kỳ hệ điều hành nào và chúng ta có thể tìm kiếm nhanh chóng ở mọi nơi!

Tôi sẽ nói thêm rằng phiên bản di động hoạt động nhanh hơn một chút (tôi không biết tại sao) so với phiên bản cài đặt, vì vậy tôi cũng khuyên bạn nên sử dụng nó!

Trong kho lưu trữ được tải xuống từ trang web của chúng tôi, bạn sẽ tìm thấy phiên bản di động của chương trình. Để làm cho nó hoạt động, chỉ cần giải nén thư mục "DocFetcher 1.1.9"đến bất kỳ vị trí nào trên PC của bạn (ngoại trừ thư mục Tệp chương trình).

Bạn cũng sẽ cần cài đặt một bộ thư viện Môi trường chạy thi hành Java (JRE) trên máy tính của mình, phiên bản 1.6.0 trở lên (hiện tại là phiên bản 7.40). Thông thường JAVA đã được cài đặt trên tất cả các hệ thống hiện đại, nhưng để đề phòng, hãy kiểm tra;)

Khi mọi thứ đã sẵn sàng, bạn có thể khởi chạy DocFetcher.

Giao diện chương trình

Sau khi chạy tệp thực thi DocFetcher.exe chúng ta sẽ thấy cửa sổ làm việc của chương trình:

Nếu hệ thống của bạn bằng tiếng Nga thì ngôn ngữ giao diện chương trình sẽ tự động là tiếng Nga nên bạn không cần thay đổi gì cả!

Bản thân giao diện bao gồm bốn phần có thể được ẩn/hiển thị bằng các nút có mũi tên màu đen:

  1. Ở góc trên bên trái có phần tùy chọn tìm kiếm. Tại đây, bạn có thể đặt kích thước tối thiểu và tối đa của tệp bạn đang tìm kiếm, cũng như chỉ định phần mở rộng của nó (tất cả các tiện ích mở rộng đều hoạt động theo mặc định);
  2. Ở góc trên bên phải của cửa sổ có thanh tìm kiếm với trường đầu ra kết quả. Tại đây, ở bên phải thanh tìm kiếm, bạn có thể thấy các nút bổ sung gọi trợ giúp, cài đặt và ẩn cửa sổ chương trình trong khay.
  3. Khu vực tìm kiếm nằm ở góc dưới bên trái. Trong phần này, tất cả các thư mục được lập chỉ mục với các tệp đang làm việc của chúng tôi sẽ được hiển thị.
  4. Ở góc dưới bên phải có cửa sổ xem trước của tệp đã chọn. Theo mặc định, cửa sổ này hiển thị readme của chương trình, nhưng ngay khi chúng ta chọn một tệp, nội dung của nó sẽ ngay lập tức được hiển thị ở đây và cụm từ hoặc từ được tìm kiếm sẽ được tô màu!

Cơ chế lập chỉ mục thư mục

Nếu bạn cố gắng tìm kiếm thứ gì đó bằng DocFetcher ngay bây giờ, bạn sẽ thất bại, vì để tìm kiếm, trước tiên chương trình phải lập chỉ mục các thư mục chứa các tệp chúng ta cần!

Để thực hiện việc này, chúng ta cần gọi menu ngữ cảnh của khu vực tìm kiếm và di chuột qua mục hoạt động duy nhất “Tạo chỉ mục từ”:

Ví dụ: tôi sẽ lập chỉ mục thư mục làm việc của mình với các bài viết bằng cách chọn mục “Thư mục”. Tuy nhiên, ngoài các thư mục, DocFetcher có thể lập chỉ mục các kho lưu trữ, tệp lưu trữ email Outlook và vì lý do nào đó, bảng nhớ tạm.

Sau khi chọn chế độ lập chỉ mục, chúng ta sẽ được yêu cầu chỉ định thư mục cần quét và sau đó chúng ta sẽ thấy cửa sổ sau:

Ở đây chúng ta có thể đặt các tham số lập chỉ mục như:

  • hướng dẫn đặc biệt để xử lý một số loại tệp nhất định;
  • loại trừ một số tệp nhất định khỏi chỉ mục theo phần mở rộng hoặc loại MIME (các biểu thức thông thường được hỗ trợ);
  • các cài đặt bổ sung khác.

Nếu bạn là người dùng bình thường thì bạn không cần thay đổi bất cứ điều gì ở đây. Nếu bạn là nhà phát triển, tôi khuyên bạn nên chỉ định các tệp chứa mã của bạn dưới dạng tệp văn bản trong phần “Phần mở rộng tệp”.

Điều này là cần thiết để DocFetcher tìm kiếm các biểu thức cần thiết bên trong mã (ví dụ: theo mặc định, các tệp PHP được xử lý giống như HTML, nghĩa là việc tìm kiếm chỉ được thực hiện bằng văn bản hiển thị trong trình duyệt!).

Nếu bạn hài lòng với tất cả các cài đặt, hãy nhấp vào nút “Chạy” và đợi quá trình lập chỉ mục hoàn tất:

Chương trình chỉ mất vài giây để quét các thư mục nhỏ với số lượng tệp nhỏ. Tuy nhiên, nếu các thư mục lớn và có cấu trúc phức tạp gồm các tệp đính kèm với kho lưu trữ và hình ảnh thì việc lập chỉ mục có thể mất một chút thời gian.

Như bạn có thể thấy từ ảnh chụp màn hình, DocFetcher đã xử lý thư mục làm việc của tôi nặng 3,6 Gigabyte, như máy quét tuyên bố, chứa gần 46 nghìn tệp (bao gồm cả trong kho lưu trữ) trong gần nửa giờ! Khá lâu nhưng đáng giá!

Đúng! Tôi không khuyên bạn nên lập chỉ mục các thư mục hệ thống (và Ổ C nói chung), vì điều này trước hết sẽ làm chậm chương trình và thứ hai, nó thường có thể dẫn đến “màn hình xanh chết chóc” do thay đổi nội dung thường xuyên. ..

Và một điều nữa... Càng nhiều file trong thư mục được lập chỉ mục thì chương trình sẽ càng tiêu tốn nhiều RAM để hỗ trợ việc lập chỉ mục. Ví dụ: 46 nghìn tệp của tôi ở chế độ không tải sẽ “ngốn” tới 200 megabyte RAM và tới 20% bộ xử lý! Và trong chế độ tìm kiếm, tất cả tài nguyên đều được sử dụng (may mắn thay, quá trình tìm kiếm chỉ mất vài giây).

Chà, bây giờ có vẻ như bạn đã biết mọi thứ - hãy chuyển sang phần thú vị.

Tìm kiếm tệp đơn giản trong DocFetcher

Sau khi đóng cửa sổ quét, chúng ta sẽ quay lại cửa sổ chính lần nữa nhưng lúc này chúng ta sẽ có thư mục được lập chỉ mục trong vùng tìm kiếm:

Bằng cách nhấp vào dấu cộng ở bên trái tên thư mục, chúng ta sẽ mở rộng cấu trúc của nó và có thể nhìn thấy cây thư mục. Hơn nữa, cùng với các thư mục thông thường, cây còn bao gồm các kho lưu trữ, cấu trúc tệp đính kèm mà chúng ta cũng có thể xem!

Theo mặc định, tất cả các thư mục trong thư mục được lập chỉ mục đều được đánh dấu để tìm kiếm. Tuy nhiên, chúng tôi luôn có thể thu hẹp trường tìm kiếm bằng cách chỉ kiểm tra các thư mục hoặc kho lưu trữ cần thiết.

Hãy để toàn bộ thư mục được chọn và thử đặt từ đầu tiên để tìm kiếm. Ví dụ, hãy là từ "trình cài đặt". Nhập từ vào thanh tìm kiếm và nhấp vào nút “Tìm kiếm”:

Chương trình suy nghĩ trong 3 giây rồi tạo ra danh sách 180 tệp (xem góc dưới bên trái để biết “Kết quả”) trong đó từ được tìm kiếm xuất hiện ở cùng dạng mà chúng tôi đã nhập.

Theo mặc định, tất cả các tệp được sắp xếp theo chỉ báo “Lượt truy cập”, biểu thị dưới dạng phần trăm mức độ liên quan của từng tệp với truy vấn đã nhập. Trong ví dụ của chúng tôi, tỷ lệ phần trăm khớp tối đa - 22% - được gán cho một tệp trong đó từ tìm kiếm xuất hiện hai lần (và trong cùng một đoạn).

Nếu bạn chọn tệp này trong danh sách tìm kiếm, nội dung của nó sẽ được hiển thị trong cửa sổ xem trước và kết quả phù hợp đầu tiên được tìm thấy sẽ được đánh dấu bằng màu xanh lam (giống như lựa chọn thông thường). Các kết quả phù hợp tiếp theo sẽ được đánh dấu màu vàng và bạn có thể nhanh chóng điều hướng đến chúng bằng cách sử dụng nút mũi tên lên và xuống trên thanh công cụ khung nhìn.

Trên cùng một bảng điều khiển dành cho các tệp văn bản thông thường, có thêm hai nút cho phép bạn tắt tính năng đánh dấu kết quả tìm kiếm và bật/tắt chế độ xem HTML (nếu có cho loại tệp này).

Và một điều cuối cùng. Bạn có thể mở bất kỳ tệp nào trong danh sách tệp được tìm thấy bằng cách nhấp đúp thông thường hoặc sử dụng menu ngữ cảnh. Cái sau cũng chứa các mục cho phép bạn mở thư mục mẹ của tệp hoặc sao chép chính tệp đó vào bảng tạm.

Sử dụng mặt nạ tìm kiếm

Người dùng nâng cao (và đôi khi không quá nâng cao) biết rằng bạn có thể tìm kiếm trong các công cụ tìm kiếm trên Internet không chỉ bằng các truy vấn đơn giản mà còn sử dụng nhiều tính năng đặc biệt cho phép bạn bao gồm/loại trừ một số từ nhất định trong/khỏi kết quả tìm kiếm, tìm kiếm không chính xác trận đấu, v.v. .P.

DocFetcher, về cơ bản là cùng một công cụ tìm kiếm, nhưng cục bộ, cũng có thể thực hiện việc này :). Tuy nhiên, không giống như các rô-bốt tìm kiếm thông thường, theo mặc định, nó chỉ tìm kiếm các kết quả khớp chính xác với truy vấn. Để khắc phục hạn chế này, bạn cần sử dụng các ký tự đặc biệt «?» «*» . Hãy để tôi giải thích bằng một ví dụ với từ đã được đề cập ở trên "trình cài đặt":

Tính cách đặc biệt "?" thay thế bất kỳ một chữ cái nào. Nghĩa là, nếu chúng ta đặt nó ở cuối từ đã tìm kiếm, thì chúng ta có thể tìm thấy các tệp trong đó có nhiều dạng khác nhau của từ này, trong đó chỉ có chữ cái cuối cùng thay đổi (xem ảnh chụp màn hình ở trên: “trình cài đặt”, “trình cài đặt” , vân vân.) . Tuy nhiên, bạn nên nhớ rằng với cách tìm kiếm như vậy, các tệp có dạng chính của từ tìm kiếm sẽ không được tìm thấy!

Để tìm kiếm linh hoạt hơn, hãy sử dụng ký tự đặc biệt “*”:

Biểu tượng này cho phép bạn tìm các kết quả hoàn toàn tương đương với truy vấn hoặc có các kết thúc khác nhau, có thể không bao gồm một chữ cái, như trong trường hợp trước (ví dụ: các tệp có từ “trình cài đặt”, “trình cài đặt”, “trình cài đặt” và thậm chí là “trình cài đặt”).

Luôn sử dụng dấu hoa thị khi bạn muốn chỉ định kết quả khớp không chính xác cho truy vấn!

Nhân tiện, trong ảnh chụp màn hình ở trên, chúng ta có thể thấy chức năng xử lý mã HTML được kích hoạt. Ở chế độ này, cửa sổ xem trước sẽ biến thành một trình duyệt nhỏ với các nút điều hướng, thanh tìm kiếm và tất cả các thuộc tính được yêu cầu. Bạn có thể chuyển sang chế độ xem mã bằng nút ngoài cùng bên phải.

Ngoài việc sử dụng các ký tự đặc biệt nêu trên, DocFetcher còn hỗ trợ một số chức năng tìm kiếm khác:

  • Các toán tử Boolean "AND", "OR" và "NOT" (tương tự như "&&", "||" và "-") để tìm kiếm có chứa hai từ khóa cùng một lúc, một trong các từ khóa hoặc loại trừ một trong các từ khóa đó từ. Ví dụ: “cat && dog” - tất cả tài liệu trong đó xuất hiện từ “cat” và “dog” sẽ được tìm thấy, “cat OR dog” - tài liệu có ít nhất một trong các từ được tìm thấy, “cat - dog” - những tài liệu chỉ có từ "mèo" mà không đề cập đến từ "chó". Bạn có thể kết hợp nhiều toán tử, ví dụ: truy vấn "(cat OR dog) AND mouse" sẽ trả về tất cả tài liệu có chứa từ "cat" hoặc "dog" cũng như từ "mouse".
  • Các ký tự đặc biệt của cụm từ. Điều này bao gồm dấu ngoặc kép và dấu "+". Ví dụ: một cụm từ được đặt trong dấu ngoặc kép sẽ được tìm kiếm ở dạng không thay đổi (dạng bạn đã viết cụm từ đó). Chức năng này tương tự như chức năng tìm kiếm chính xác trong các công cụ tìm kiếm thông thường. Dấu “+” cho biết từ được đánh dấu bởi nó có mức độ ưu tiên, trong khi các từ còn lại của truy vấn có thể không xuất hiện. Ví dụ: yêu cầu “+cat dog” trước tiên sẽ cung cấp cho chúng tôi tất cả các tệp có chứa cả hai từ khóa và sau đó là những tệp chỉ chứa từ “mèo”. Nếu bạn thêm “+” vào tất cả các từ truy vấn, kết quả sẽ tương đương với việc sử dụng toán tử “AND”.
  • Tìm kiếm các từ tương tự. Với DocFetcher chúng ta có thể tìm kiếm những file chứa những từ gần giống với từ khóa. Để thực hiện việc này, hãy sử dụng ký tự đặc biệt “~” ở cuối từ khóa. Ví dụ: truy vấn “cat~” có thể trả về các từ “code”, “that”, “sweat”, v.v. Ngoài ra, chúng ta có thể chỉ định mức độ tương tự trong phạm vi từ “0” đến “1”. Theo mặc định (nếu chúng tôi chưa chỉ định giá trị), mức độ này là "0,5" (tương đương với truy vấn "cat ~0,5").
  • Tìm kiếm theo thuộc tính tập tin. Trong thực tế, thường cần phải tìm các tệp không chỉ (và không quá nhiều) theo nội dung mà còn theo các thuộc tính nhất định. Ví dụ: chúng tôi muốn tìm tất cả các bức thư của Vasya Pupkin. Để thực hiện việc này, bạn có thể sử dụng yêu cầu sau: “người gửi:“ Vasya Pupkin ””. Thật không may, tìm kiếm thuộc tính chỉ khả dụng cho các tệp văn bản (thuộc tính: tiêu đề, tên tệp và tác giả) và tệp email (thuộc tính: chủ đề, người gửi và người nhận).

Ngoài ra còn có một số chức năng tìm kiếm cụ thể khác, nhưng vì chúng không có nhu cầu đặc biệt nên chúng tôi sẽ không xem xét chúng (nếu muốn, bạn có thể đọc về chúng trong sách hướng dẫn sử dụng tiếng Anh cho chương trình trong phần “Cú pháp truy vấn”).

Menu ngữ cảnh khu vực tìm kiếm

Tôi đã suy nghĩ rất lâu liệu có đáng để tập trung vào menu ngữ cảnh hay không, nhưng cuối cùng, để hoàn thành bức tranh, có thể nói, tôi quyết định dừng lại :). Nếu bạn còn nhớ, ngay từ đầu, chỉ có mục đầu tiên được kích hoạt ở đây - “Tạo chỉ mục từ”. Bây giờ, sau khi lập chỉ mục thư mục, tất cả các tùy chọn khác sẽ có sẵn cho chúng tôi:

Nếu chúng ta không tính đến các chức năng rõ ràng như “Cập nhật chỉ mục” hoặc “Xóa các chỉ mục “chết”, thì chúng ta sẽ chỉ quan tâm đến mục cuối cùng của menu ngữ cảnh - “Danh sách tài liệu”. Bằng cách kích hoạt nó, chúng tôi sẽ nhận được trong trường kết quả tìm kiếm không phải là kết quả của bất kỳ truy vấn nào mà là danh sách tất cả các tệp trong thư mục mà chức năng hiển thị danh sách tài liệu được gọi. Đôi khi một cơ hội như vậy sẽ hữu ích và thậm chí thuận tiện!

Cài đặt DocFetcher

Bạn có thể truy cập một số cài đặt của chương trình bằng cách nhấp vào nút thứ hai ở bên phải dòng tìm kiếm:

Ở đây tất cả các thông số phải rõ ràng và không cần giải thích thêm. Điều duy nhất bạn nên chú ý là liên kết "Cài đặt nâng cao" ở góc dưới bên trái. Nhấp vào nó sẽ mở ra một tệp cấu hình văn bản trong đó bạn có thể thực hiện một số điều chỉnh tốt.

Than ôi, các nhận xét về cài đặt (và chính chúng) đều bằng tiếng Anh, vì vậy tôi khuyên bạn chỉ nên thay đổi bất cứ điều gì nếu bạn hiểu rõ tham số đã chọn sẽ ảnh hưởng gì!

Ưu điểm và nhược điểm của chương trình

  • tìm kiếm gần như ngay lập tức theo tên tệp và nội dung;
  • khả năng tạo các truy vấn phức tạp;
  • sắp xếp kết quả tìm kiếm theo mức độ liên quan;
  • tìm kiếm trong kho lưu trữ;
  • xem trước nội dung tập tin với đánh dấu truy vấn.
  • sự cần thiết phải lập chỉ mục sơ bộ của các tập tin;
  • theo mặc định, một kết quả khớp nghiêm ngặt với yêu cầu sẽ được tìm kiếm, điều này không phải lúc nào cũng thuận tiện;
  • tiêu thụ tài nguyên cao khi lập chỉ mục một số lượng lớn tệp.

kết luận

DocFetcher không phải là chương trình duy nhất thuộc loại này mà là một trong những chương trình có nhiều chức năng nhất, thậm chí so với phần mềm trả phí.

Theo tôi, nhược điểm nghiêm trọng duy nhất là ứng dụng được viết bằng JAVA, bất chấp mọi tuyên bố của các nhà phát triển, hệ thống tải rất nặng. Tất nhiên, đối với các PC đa lõi hiện đại, đây không phải là vấn đề, nhưng trên các máy cũ hơn, đôi khi có thể quan sát thấy hiện tượng “phanh”.

Mặt khác, DocFetcher là một công cụ tìm kiếm tuyệt vời mà trong giây lát có thể tìm thấy bất kỳ tệp quan trọng nào chỉ dựa trên một từ chứa trong đó. Chương trình cũng sẽ không thể thiếu đối với các nhà phát triển vì nó cho phép bạn tìm kiếm bất kỳ cấu trúc mã phức tạp nào.

tái bút Được phép tự do sao chép và trích dẫn bài viết này, với điều kiện là phải chỉ ra một liên kết hoạt động mở tới nguồn và quyền tác giả của Ruslan Tertyshny được giữ nguyên.

Xin chào các bạn. Hãy cho tôi biết bạn mất bao nhiêu thời gian để tìm kiếm các tập tin trên máy tính của mình. Tôi nghĩ rất nhiều, và thậm chí còn hơn thế nữa nếu bạn điều hành blog của riêng mình trên Internet hoặc chỉ là một nhiếp ảnh gia. Trong trường hợp này, một số lượng rất lớn các tập tin được thu thập. Có một số cách để nhanh chóng tìm thấy tập tin bạn cần. Ví dụ như thế này hoặc thế này

Thật tốt nếu bạn biết chắc chắn rằng họ ở đó. Điều gì sẽ xảy ra nếu bạn đang tìm kiếm tập tin mình cần và biết chắc chắn rằng nó nằm trên máy tính, ở đâu và trong thư mục nào? Thôi, bệnh xơ cứng cứ đến thăm. Và khi đó chương trình FileSearchy sẽ giúp chúng ta. Xem khả năng của nó.

Đó là một chương trình thú vị, tôi sử dụng nó thường xuyên và giới thiệu nó cho bạn.

Cô ấy trông như thế này. Ở phía bên trái có một dòng tìm kiếm, bạn phải nhập tên của tập tin bị mất. Sau đó, nhấp vào nút nằm ở dưới cùng của cửa sổ chương trình.

Trong vòng chưa đầy năm giây, chương trình sẽ quét tất cả các ổ đĩa cứng và trả về tất cả các tệp có từ bạn đã nhập vào công cụ tìm kiếm trong tên của chúng. Bạn thấy chương trình FileSearchy hoạt động rất nhanh nhưng nếu họ bắt đầu tìm kiếm thủ công thì chắc chắn sẽ không phù hợp với thời gian mà chương trình cần để hoàn thành.

Vì vậy, chúng tôi tìm kiếm tất cả các tệp có chứa kết quả phù hợp với yêu cầu của chúng tôi. Và có thể có rất nhiều tệp chứa cùng một từ, và do đó chúng ta sẽ vẫn phải mất chút thời gian. Trong trường hợp này, chương trình cung cấp cho chúng tôi tìm kiếm nâng cao. Điều đó được đơn giản hóa.

Tìm kiếm tệp trên máy tính của bạn theo loại

Nếu chúng ta chỉ cần tìm hình ảnh thì chúng ta đang tìm kiếm hình ảnh. Nếu chỉ có các thư mục thì chúng tôi yêu cầu chương trình chỉ hiển thị các thư mục được tìm thấy dưới tên mà chúng tôi đã nhập trong công cụ tìm kiếm. Nói chung, chúng tôi sắp xếp. Tìm tất cả các tệp và sau đó chỉ định loại tệp , bằng cách chọn hộp.

Bằng cách này bạn sẽ tiết kiệm được nhiều thời gian hơn. FileSearchy có thể nhận dạng các loại tệp như hình ảnh, âm thanh, video, tài liệu, chương trình và thư mục.

FileSearchy còn có các tính năng khác. Ví dụ: chúng tôi chỉ cần các tệp từ ổ “D”. Trong dòng tìm kiếm, hãy chọn hộp bên cạnh mục “Trong thư mục”. Chúng tôi sẽ tìm kiếm ở một vị trí cụ thể chứ không phải trong toàn bộ bộ nhớ máy tính. Nhìn vào hình ảnh để biết điều này được thực hiện như thế nào.

Nhân tiện, chương trình cho phép chúng tôi chọn một số địa điểm để tìm kiếm cùng một lúc. Cho phép nó trên ổ “E” và trong một trong các thư mục trên bất kỳ ổ đĩa nào khác.

Bạn cũng có thể loại trừ khỏi tìm kiếm một số thư mục (ổ đĩa hoặc thư mục). Điều này có nghĩa là nếu bạn tìm kiếm trên toàn bộ máy tính, thì những thư mục bị loại khỏi tìm kiếm sẽ không được quét và sẽ không xuất hiện trong kết quả tìm kiếm.

Xin lưu ý rằng những thư mục và ổ đĩa không được quét sẽ có dấu chấm than trước tên ổ đĩa hoặc tên thư mục.

Vì vậy, bằng cách nhấp vào mũi tên trong tìm kiếm, chúng ta sẽ biết những gì sẽ được quét và những gì chương trình sẽ loại trừ khỏi tìm kiếm.

Vâng, và một số tính năng khác của chương trình này, về nguyên tắc, tôi rất hiếm khi sử dụng. Mặc dù trong một số trường hợp chúng sẽ rất hữu ích.

Tìm tập tin trong nội dung tài liệu

Trong tham số tìm kiếm có mục “Trong nội dung”. Chế độ tìm kiếm này liên quan nhiều hơn đến việc tìm kiếm tài liệu văn bản. Giả sử bạn quên cách ký tài liệu. Ví dụ: chúng tôi đã tải xuống một cuốn sách từ Internet có tựa đề bằng tiếng Anh hoặc phiên âm. Bạn không biết viết thế nào cho đúng, nhưng hãy nhớ những từ nào được tìm thấy trong đó.

Và hai bộ lọc nữa có thể áp dụng là tìm kiếm theo ngày và kích thước. Mọi thứ đều rõ ràng ở đây.

Phiên bản tôi đang sử dụng.

Và đối với những người không muốn cài đặt chương trình trên máy tính của mình, có phiên bản di động của một chương trình tương tự. Tôi sẽ nói ngay rằng nó không quá hấp dẫn về mặt giao diện nhưng nó có những tính năng thú vị riêng.

Bạn có thể tìm hiểu về nó và tải xuống từ trang web chính thức http://www.voidtools.com

Điều này rất hữu ích để biết:


Tìm kiếm trên Internet chuyên nghiệp yêu cầu phần mềm chuyên dụng cũng như các công cụ tìm kiếm và dịch vụ tìm kiếm chuyên dụng.

CHƯƠNG TRÌNH

http://dr-watson.wix.com/home – chương trình được thiết kế để nghiên cứu các mảng thông tin văn bản nhằm xác định các thực thể và kết nối giữa chúng. Kết quả của công việc là một báo cáo về đối tượng đang nghiên cứu.

http://www.fmsasg.com/ - một trong những chương trình tốt nhất trên thế giới để trực quan hóa các kết nối và mối quan hệ Sentinel Vizualizer. Công ty đã Nga hóa hoàn toàn các sản phẩm của mình và kết nối đường dây nóng bằng tiếng Nga.

http://www.newprosoft.com/ – “Web Content Extractor” là phần mềm mạnh mẽ, dễ sử dụng nhất để trích xuất dữ liệu từ các trang web. Nó cũng có một con nhện Visual Web hiệu quả.

Trang webSputnik một gói phần mềm không có phần mềm tương tự trên thế giới, cho phép bạn tìm kiếm và xử lý kết quả của nó trên Internet Hữu hình và Vô hình, sử dụng tất cả các công cụ tìm kiếm cần thiết cho người dùng.

WebSite-Watcher – cho phép bạn giám sát các trang web, bao gồm các trang được bảo vệ bằng mật khẩu, diễn đàn giám sát, nguồn cấp dữ liệu RSS, nhóm tin tức, tệp cục bộ. Có hệ thống lọc mạnh mẽ. Việc giám sát được thực hiện tự động và được cung cấp dưới dạng thân thiện với người dùng. Một chương trình có các chức năng nâng cao có giá 50 euro. Cập nhật liên tục.

http://www.scribd.com/ là nền tảng phổ biến nhất trên thế giới và ngày càng được sử dụng nhiều ở Nga để đăng các loại tài liệu, sách, v.v. để truy cập miễn phí với một công cụ tìm kiếm rất thuận tiện cho các tiêu đề, chủ đề, v.v.

http://www.atlasti.com/ là công cụ mạnh mẽ và hiệu quả nhất để phân tích thông tin định tính dành cho người dùng cá nhân, doanh nghiệp vừa và nhỏ. Chương trình này đa chức năng và do đó hữu ích. Nó kết hợp khả năng tạo ra một môi trường thông tin thống nhất để làm việc với nhiều tệp văn bản, dạng bảng, âm thanh và video khác nhau, cũng như các công cụ để phân tích và trực quan hóa định tính.

Ashampoo ClipFinder HD – tỷ lệ luồng thông tin đến từ video ngày càng tăng. Theo đó, các quan chức tình báo cạnh tranh cần có những công cụ cho phép họ làm việc với định dạng này. Một sản phẩm như vậy là tiện ích miễn phí mà chúng tôi giới thiệu. Nó cho phép bạn tìm kiếm video dựa trên các tiêu chí được chỉ định trên các trang lưu trữ tệp video như YouTube. Chương trình rất dễ sử dụng, hiển thị tất cả kết quả tìm kiếm trên một trang với thông tin chi tiết, tiêu đề, thời lượng, thời gian video được tải lên bộ lưu trữ, v.v. Có giao diện tiếng Nga.

http://www.advego.ru/plagiatus/ – chương trình được tạo bởi các nhà tối ưu hóa SEO, nhưng khá phù hợp làm công cụ thông minh trên Internet. Đạo văn thể hiện mức độ độc đáo của văn bản, nguồn gốc của văn bản và tỷ lệ phần trăm văn bản trùng khớp. Chương trình cũng kiểm tra tính duy nhất của URL được chỉ định. Chương trình này là miễn phí.

http://neiron.ru/toolbar/ – bao gồm một tiện ích bổ sung để kết hợp tìm kiếm Google và Yandex, đồng thời cho phép phân tích cạnh tranh dựa trên việc đánh giá tính hiệu quả của các trang web và quảng cáo theo ngữ cảnh. Triển khai như một plugin cho FF và GC.

http://web-data-extractor.net/ là một giải pháp phổ quát để lấy bất kỳ dữ liệu nào có sẵn trên Internet. Việc thiết lập cắt dữ liệu từ bất kỳ trang nào được thực hiện chỉ bằng vài cú click chuột. Bạn chỉ cần chọn vùng dữ liệu muốn lưu và Datacol sẽ tự động chọn công thức cắt khối này.

CaptureSaver là một công cụ nghiên cứu Internet chuyên nghiệp. Đơn giản chỉ là một chương trình làm việc không thể thiếu cho phép bạn nắm bắt, lưu trữ và xuất bất kỳ thông tin Internet nào, bao gồm không chỉ các trang web, blog mà còn cả tin tức RSS, email, hình ảnh và nhiều hơn thế nữa. Nó có chức năng rộng nhất, giao diện trực quan và mức giá vô lý.

http://www.orbiscope.net/en/software.html – hệ thống giám sát web với mức giá phải chăng hơn.

http://www.kbcrawl.co.uk/ – phần mềm để làm việc, bao gồm cả trên “Internet vô hình”.

http://www.copernic.com/en/products/agent/index.html – chương trình cho phép bạn tìm kiếm bằng hơn 90 công cụ tìm kiếm, sử dụng hơn 10 tham số. Cho phép bạn kết hợp các kết quả, loại bỏ trùng lặp, chặn các liên kết bị hỏng và hiển thị các kết quả phù hợp nhất. Có phiên bản miễn phí, cá nhân và chuyên nghiệp. Được sử dụng bởi hơn 20 triệu người dùng.

Maltego là một phần mềm mới về cơ bản cho phép bạn thiết lập mối quan hệ giữa các chủ đề, sự kiện và đối tượng trong đời thực và trên Internet.

DỊCH VỤ

https://hunter.io/ mới – dịch vụ phát hiện và kiểm tra email hiệu quả.

https://www.whatruns.com/ là một trình quét dễ sử dụng nhưng hiệu quả để khám phá những gì đang và không hoạt động trên một trang web cũng như các lỗ hổng bảo mật của nó. Cũng được triển khai dưới dạng plugin cho Chrome.

https://www.crayon.co/ là một nền tảng ngân sách của Mỹ dành cho thông tin thị trường và cạnh tranh trên Internet.

http://www.cs.cornell.edu/~bwong/octant/ – mã định danh máy chủ.

https://iplogger.ru/ – một dịch vụ đơn giản và thuận tiện để xác định IP của người khác.

http://linkurio.us/ là một sản phẩm mới mạnh mẽ dành cho nhân viên an ninh kinh tế và điều tra viên tham nhũng. Xử lý và trực quan hóa lượng lớn thông tin phi cấu trúc từ các nguồn tài chính.

http://www.intelsuite.com/en – Nền tảng trực tuyến bằng tiếng Anh để theo dõi và thu thập thông tin cạnh tranh.

http://yewno.com/about/ là hệ điều hành đầu tiên chuyển thông tin thành kiến ​​thức và trực quan hóa thông tin phi cấu trúc. Hiện nay hỗ trợ tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha và tiếng Bồ Đào Nha.

https://start.avalancheonline.ru/landing/?next=%2F – dịch vụ dự báo và phân tích của Andrey Masalovich.

https://www.outwit.com/products/hub/ – một bộ chương trình độc lập hoàn chỉnh dành cho công việc chuyên môn trên web 1.

https://github.com/search?q=user%3Acmlh+maltego – tiện ích mở rộng cho Maltego.

http://www.whoishostingthis.com/ – công cụ tìm kiếm hosting, địa chỉ IP, v.v.

http://appfollow.ru/ – phân tích các ứng dụng dựa trên đánh giá, tối ưu hóa ASO, vị trí hàng đầu và kết quả tìm kiếm cho App Store, Google Play và Windows Phone Store.

http://spiraldb.com/ là một dịch vụ được triển khai dưới dạng plugin cho Chrom, cho phép bạn nhận được nhiều thông tin có giá trị về bất kỳ tài nguyên điện tử nào.

https://millie.northernlight.com/dashboard.php?id=93 - một dịch vụ miễn phí thu thập và cấu trúc thông tin quan trọng về các ngành và công ty. Có thể sử dụng bảng thông tin dựa trên phân tích văn bản.

http://byratino.info/ – thu thập dữ liệu thực tế từ các nguồn có sẵn công khai trên Internet.

http://www.datafox.co/ – Nền tảng CI thu thập và phân tích thông tin về các công ty mà khách hàng quan tâm. Có một bản demo.

https://unwiredlabs.com/home - một ứng dụng chuyên dụng có API để tìm kiếm theo vị trí địa lý của bất kỳ thiết bị nào được kết nối với Internet.

http://visualping.io/ – một dịch vụ giám sát các trang web và trước hết là các bức ảnh và hình ảnh có sẵn trên đó. Ngay cả khi bức ảnh chỉ xuất hiện trong một giây, nó sẽ có trong email của người đăng ký. Có plugin cho Google Chrome.

http://spyonweb.com/ là một công cụ nghiên cứu cho phép phân tích chuyên sâu về bất kỳ tài nguyên Internet nào.

http://bigvisor.ru/ – dịch vụ cho phép bạn theo dõi các chiến dịch quảng cáo cho các phân khúc hàng hóa và dịch vụ nhất định hoặc các tổ chức cụ thể.

http://www.itsec.pro/2013/09/microsoft-word.html – hướng dẫn từ Artem Ageev về cách sử dụng các chương trình Windows cho nhu cầu thông tin cạnh tranh.

http://granoproject.org/ là một công cụ nguồn mở dành cho các nhà nghiên cứu theo dõi mạng lưới kết nối giữa các cá nhân và tổ chức trong chính trị, kinh tế, tội phạm, v.v. Cho phép bạn kết nối, phân tích và trực quan hóa thông tin thu được từ nhiều nguồn khác nhau, cũng như hiển thị các kết nối quan trọng.

http://imgops.com/ – dịch vụ trích xuất siêu dữ liệu từ các tệp đồ họa và làm việc với chúng.

http://sergeybelove.ru/tools/one-button-scan/ – một máy quét trực tuyến nhỏ để kiểm tra các lỗ hổng bảo mật trên các trang web và các tài nguyên khác.

http://isce-library.net/epi.aspx – dịch vụ tìm kiếm các nguồn chính bằng cách sử dụng một đoạn văn bản bằng tiếng Anh

https://www.rivaliq.com/ là một công cụ hiệu quả để tiến hành thông tin tình báo cạnh tranh ở các thị trường hàng hóa và dịch vụ ở phương Tây, chủ yếu là châu Âu và châu Mỹ.

http://watchthatpage.com/ là dịch vụ cho phép bạn tự động thu thập thông tin mới từ các tài nguyên Internet được giám sát. Dịch vụ này là miễn phí.

http://falcon.io/ là một loại Báo cáo dành cho Web. Nó không phải là sự thay thế cho Rapportive nhưng cung cấp các công cụ bổ sung. Ngược lại, Rapportive cung cấp hồ sơ chung về một người, như thể được dán lại với nhau từ dữ liệu từ mạng xã hội và những lượt đề cập trên web http://watchthatpage.com/ - một dịch vụ cho phép bạn tự động thu thập thông tin mới từ các tài nguyên được giám sát trên. Internet. Dịch vụ này là miễn phí.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – tiện ích bổ sung cho Firefox. Theo dõi cập nhật trang web. Hữu ích cho các trang web không có nguồn cấp tin tức (Atom hoặc RSS).

http://agregator.pro/ – tổng hợp các cổng thông tin và truyền thông. Được sử dụng bởi các nhà tiếp thị, nhà phân tích, v.v. để phân tích các luồng tin tức về các chủ đề nhất định.

http://price.apishops.com/ – dịch vụ web tự động để theo dõi giá cho các nhóm sản phẩm được chọn, các cửa hàng trực tuyến cụ thể và các thông số khác.

http://www.la0.ru/ là một dịch vụ thuận tiện và phù hợp để phân tích các liên kết và liên kết ngược đến tài nguyên Internet.

www.recordedfuture.com là một công cụ mạnh mẽ để phân tích và trực quan hóa dữ liệu, được triển khai như một dịch vụ trực tuyến được xây dựng trên điện toán đám mây.

http://advse.ru/ là một dịch vụ có khẩu hiệu “Tìm hiểu mọi thứ về đối thủ cạnh tranh của bạn”. Cho phép bạn có được các trang web của đối thủ cạnh tranh theo truy vấn tìm kiếm và phân tích các chiến dịch quảng cáo của đối thủ cạnh tranh trên Google và Yandex.

http://spyonweb.com/ – dịch vụ cho phép bạn xác định các trang web có cùng đặc điểm, bao gồm cả những trang sử dụng cùng số nhận dạng dịch vụ thống kê Google Analytics, địa chỉ IP, v.v.

http://www.connotate.com/solutions – dòng sản phẩm dành cho thông tin cạnh tranh, quản lý luồng thông tin và chuyển đổi thông tin thành tài sản thông tin. Nó bao gồm cả nền tảng phức tạp và các dịch vụ đơn giản, giá rẻ cho phép giám sát hiệu quả cùng với việc nén thông tin và chỉ thu được kết quả cần thiết.

http://www.clearci.com/ - nền tảng thông tin cạnh tranh dành cho các doanh nghiệp thuộc nhiều quy mô khác nhau từ các công ty khởi nghiệp và công ty nhỏ đến các công ty Fortune 500 Được giải quyết dưới dạng saas.

http://startingpage.com/ là một tiện ích bổ sung của Google cho phép bạn tìm kiếm trên Google mà không cần ghi lại địa chỉ IP của mình. Hỗ trợ đầy đủ tất cả các khả năng tìm kiếm của Google, bao gồm cả tiếng Nga.

http://newspapermap.com/ là một dịch vụ độc đáo rất hữu ích cho nhân viên tình báo cạnh tranh. Kết nối định vị địa lý với công cụ tìm kiếm phương tiện trực tuyến. Những thứ kia. bạn chọn khu vực bạn quan tâm, hoặc thậm chí thành phố hoặc ngôn ngữ, xem địa điểm trên bản đồ và danh sách các phiên bản báo và tạp chí trực tuyến, nhấp vào nút thích hợp và đọc. Hỗ trợ tiếng Nga, giao diện rất thân thiện với người dùng.

http://infostream.com.ua/ là một hệ thống giám sát tin tức rất tiện lợi “Infostream”, được phân biệt bởi lựa chọn hạng nhất và hoàn toàn có thể truy cập được đối với bất kỳ ví nào, từ một trong những tác phẩm kinh điển của tìm kiếm trên Internet, D.V.

http://www.instapaper.com/ là một công cụ rất đơn giản và hiệu quả để lưu các trang web cần thiết. Có thể được sử dụng trên máy tính, iPhone, iPad, v.v.

http://screen-scraper.com/ – cho phép bạn tự động trích xuất tất cả thông tin từ các trang web, tải xuống phần lớn các định dạng tệp và tự động nhập dữ liệu vào nhiều dạng khác nhau. Nó lưu các tệp và trang đã tải xuống trong cơ sở dữ liệu và thực hiện nhiều chức năng cực kỳ hữu ích khác. Hoạt động trên tất cả các nền tảng chính, có phiên bản chuyên nghiệp miễn phí đầy đủ chức năng và rất mạnh mẽ.

http://www.mozenda.com/ - có một số gói cước và ngay cả các doanh nghiệp nhỏ cũng có thể truy cập được, một dịch vụ web để giám sát web đa chức năng và cung cấp thông tin cần thiết cho người dùng từ các trang web được chọn.

http://www.recipdonor.com/ - dịch vụ cho phép bạn tự động theo dõi mọi thứ diễn ra trên trang web của đối thủ cạnh tranh.

http://www.spyfu.com/ – và đây là trường hợp đối thủ cạnh tranh của bạn là người nước ngoài.

www.webground.su là dịch vụ giám sát Runet được tạo bởi các chuyên gia tìm kiếm trên Internet, bao gồm tất cả các nhà cung cấp thông tin, tin tức chính, v.v. và có khả năng cài đặt giám sát riêng lẻ để phù hợp với nhu cầu của người dùng.

CÔNG CỤ TÌM KIẾM

https://www.idmarch.org/ là công cụ tìm kiếm tốt nhất cho kho lưu trữ tài liệu pdf trên thế giới về mặt chất lượng. Hiện tại, hơn 18 triệu tài liệu pdf đã được lập chỉ mục, từ sách đến báo cáo bí mật.

http://www.marketvisual.com/ là một công cụ tìm kiếm độc đáo cho phép bạn tìm kiếm chủ sở hữu và quản lý cấp cao theo tên đầy đủ, tên công ty, chức vụ hoặc kết hợp chúng. Kết quả tìm kiếm không chỉ chứa các đối tượng bạn đang tìm kiếm mà còn chứa các kết nối của chúng. Được thiết kế chủ yếu cho các nước nói tiếng Anh.

http://worldc.am/ là một công cụ tìm kiếm các bức ảnh có thể truy cập miễn phí được liên kết với vị trí địa lý.

https://app.echosec.net/ là một công cụ tìm kiếm công cộng tự mô tả là công cụ phân tích tiên tiến nhất dành cho các chuyên gia thực thi pháp luật, an ninh và tình báo. Cho phép bạn tìm kiếm ảnh được đăng trên nhiều trang web, nền tảng xã hội và mạng xã hội khác nhau liên quan đến tọa độ vị trí địa lý cụ thể. Hiện tại có bảy nguồn dữ liệu được kết nối. Đến cuối năm, số lượng của họ sẽ lên tới hơn 450. Cảm ơn Dementy đã cho tiền boa.

http://www.quandl.com/ là công cụ tìm kiếm bảy triệu cơ sở dữ liệu tài chính, kinh tế và xã hội.

http://bitzakaz.ru/ – công cụ tìm kiếm đấu thầu và đơn đặt hàng của chính phủ với các chức năng trả phí bổ sung

Công cụ tìm kiếm trang web - giúp bạn có thể tìm thấy các trang web mà Google không lập chỉ mục tốt. Hạn chế duy nhất là nó chỉ tìm kiếm được 30 trang web cho mỗi từ khóa. Chương trình rất dễ sử dụng.

http://www.dtsearch.com/ là một công cụ tìm kiếm mạnh mẽ cho phép bạn xử lý hàng terabyte văn bản. Hoạt động trên máy tính để bàn, web và mạng nội bộ. Hỗ trợ cả dữ liệu tĩnh và động. Cho phép bạn tìm kiếm trong tất cả các chương trình MS Office. Việc tìm kiếm được thực hiện bằng cách sử dụng các cụm từ, từ, thẻ, chỉ mục và nhiều hơn nữa. Công cụ tìm kiếm liên kết duy nhất hiện có. Nó có cả phiên bản trả phí và miễn phí.

http://www.strategator.com/ – tìm kiếm, lọc và tổng hợp thông tin về công ty từ hàng chục nghìn nguồn web. Tìm kiếm ở Hoa Kỳ, Anh, các nước EEC lớn. Nó rất phù hợp, thân thiện với người dùng và có các tùy chọn miễn phí và trả phí ($14 mỗi tháng).

http://www.shodanhq.com/ là một công cụ tìm kiếm khác thường. Ngay sau khi xuất hiện, anh đã nhận được biệt danh “Google dành cho hacker”. Nó không tìm kiếm các trang mà xác định địa chỉ IP, loại bộ định tuyến, máy tính, máy chủ và máy trạm được đặt tại một địa chỉ cụ thể, theo dõi chuỗi máy chủ DNS và cho phép bạn triển khai nhiều chức năng thú vị khác để thu thập thông tin cạnh tranh.

http://search.usa.gov/ là công cụ tìm kiếm các trang web và cơ sở dữ liệu mở của tất cả các cơ quan chính phủ Hoa Kỳ. Cơ sở dữ liệu chứa rất nhiều thông tin thiết thực, hữu ích, bao gồm cả thông tin được sử dụng ở nước ta.

http://visual.ly/ – ngày nay trực quan ngày càng được sử dụng nhiều để trình bày dữ liệu. Đây là công cụ tìm kiếm đồ họa thông tin đầu tiên trên Web. Cùng với công cụ tìm kiếm, cổng thông tin còn có các công cụ trực quan hóa dữ liệu mạnh mẽ không yêu cầu kỹ năng lập trình.

http://go.mail.ru/realtime – tìm kiếm các cuộc thảo luận về chủ đề, sự kiện, đối tượng, chủ đề trong thời gian thực hoặc có thể tùy chỉnh. Tính năng tìm kiếm bị chỉ trích nhiều trước đây trong Mail.ru hoạt động rất hiệu quả và cung cấp các kết quả thú vị, phù hợp.

Zanran mới ra mắt nhưng đã hoạt động rất tốt, công cụ tìm kiếm dữ liệu đầu tiên và duy nhất trích xuất dữ liệu từ tệp PDF, bảng EXCEL, dữ liệu trên trang HTML.

http://www.ciradar.com/Competitive-Analysis.aspx là một trong những hệ thống truy xuất thông tin tốt nhất thế giới về thông tin cạnh tranh trên web sâu. Truy xuất hầu hết tất cả các loại tệp ở mọi định dạng về chủ đề quan tâm. Thực hiện như một dịch vụ web. Giá cả hợp lý hơn.

http://public.ru/ – Tìm kiếm hiệu quả và phân tích thông tin, phương tiện lưu trữ chuyên nghiệp từ năm 1990. Thư viện phương tiện truyền thông trực tuyến cung cấp nhiều loại dịch vụ thông tin: từ quyền truy cập vào kho lưu trữ điện tử của các ấn phẩm truyền thông tiếng Nga và các bài phê bình báo chí theo chủ đề được làm sẵn đến giám sát cá nhân và nghiên cứu phân tích độc quyền dựa trên tài liệu báo chí.

Cluuz là một công cụ tìm kiếm trẻ với nhiều cơ hội thu thập thông tin cạnh tranh, đặc biệt là trên Internet tiếng Anh. Cho phép bạn không chỉ tìm kiếm mà còn trực quan hóa và thiết lập kết nối giữa mọi người, công ty, tên miền, e-mail, địa chỉ, v.v.

www.wolframalpha.com – công cụ tìm kiếm của ngày mai. Để đáp lại yêu cầu tìm kiếm, nó cung cấp thông tin thống kê và thực tế có sẵn về đối tượng yêu cầu, bao gồm cả thông tin trực quan.

www.ist-budget.ru – tìm kiếm phổ biến trong cơ sở dữ liệu về mua sắm, đấu thầu, đấu giá của chính phủ, v.v.


Có thể nói rằng trong thời đại công nghệ thông tin và sự phát triển không ngừng của khối lượng dữ liệu có sẵn cho cả cá nhân và xã hội, có rất nhiều vấn đề trong việc xử lý và tìm kiếm thông tin đã là báng bổ. Ai không nêu chủ đề này? Và để không tạo gánh nặng cho bạn với những đánh giá chủ quan và một phần là khách quan được rút ra từ nhiều nguồn thông tin khác nhau liên quan đến vấn đề, tôi sẽ chuyển thẳng sang giải pháp của nó. Hôm nay chúng ta sẽ nói về tìm kiếm. Đó là về các chương trình và hệ thống thông tin nghiêm túc tìm kiếm tài liệu và dữ liệu mà chúng ta cần.

Nâng cấp "tìm kiếm trực tiếp"

Cách đây không lâu, khi số cây còn lớn và thậm chí không có nhiều thông tin trên mạng cục bộ của doanh nghiệp, mọi tìm kiếm đều được thực hiện bằng cách chỉ cần tìm kiếm qua một số tệp có sẵn và kiểm tra tuần tự tên và nội dung của chúng. Việc tìm kiếm như vậy được gọi là trực tiếp và các chương trình (tiện ích) sử dụng công nghệ tìm kiếm trực tiếp thường có trong tất cả các hệ điều hành và gói công cụ. Nhưng ngay cả sức mạnh của máy tính hiện đại cũng không đủ để tìm kiếm nhanh chóng và đầy đủ với khối lượng dữ liệu khổng lồ trong quá trình tìm kiếm trực tiếp. Tìm kiếm trong vài trăm tài liệu trên đĩa và tìm kiếm trong thư viện khổng lồ và hàng chục hộp thư là hai việc khác nhau. Do đó, các chương trình tìm kiếm trực tiếp ngày nay rõ ràng đang mờ nhạt dần - khi nói đến các công cụ phổ quát.

Tất nhiên, loại tìm kiếm này đã không còn có nhu cầu trong khu vực doanh nghiệp trong một thời gian dài. Khối lượng không giống nhau. Và, do đó, trong nhiều năm nay và gần đây, rõ ràng, các công nghệ có khả năng tìm kiếm nhanh chóng và chính xác các tài liệu ở nhiều định dạng khác nhau và từ nhiều nguồn khác nhau là rất phù hợp. Cách đây không lâu, “cha đẻ” của Microsoft, Bill Gates, dường như rất ghen tị với thành công phi thường của công cụ tìm kiếm Internet Google, tại một trong những cuộc họp báo đã tuyên bố mong muốn của ngành công nghiệp phần mềm (và không chỉ) đóng góp bằng mọi cách có thể, phát triển và tăng cường sáng tạo các công cụ và công nghệ tìm kiếm. Nhưng còn quá sớm để tạo ra bất kỳ chương trình hoạt động phi thường nào từ Microsoft hoặc một máy chủ cạnh tranh trên Internet (MSN vẫn chưa đến được với Google). Vì vậy, hãy chuyển sang những phát triển hiện có. Chỉ mục, truy vấn, mức độ liên quan

Các công nghệ hiện đại dựa trên hai quy trình cơ bản. Đầu tiên, nó lập chỉ mục các thông tin có sẵn và xử lý yêu cầu với kết quả đầu ra tiếp theo. Đối với chương trình đầu tiên, bất kỳ chương trình nào (có thể là công cụ tìm kiếm trên máy tính để bàn, hệ thống thông tin công ty hoặc công cụ tìm kiếm trên Internet) đều tạo ra khu vực tìm kiếm riêng. Nghĩa là, nó xử lý tài liệu và tạo ra chỉ mục của các tài liệu này (một cấu trúc có tổ chức chứa thông tin về dữ liệu đã xử lý). Trong tương lai, chỉ mục đã tạo sẽ được sử dụng cho công việc - nhanh chóng có được danh sách các tài liệu cần thiết theo yêu cầu. Những gì tiếp theo, mặc dù không hề đơn giản về mặt công nghệ, nhưng lại khá dễ hiểu đối với người dùng bình thường. Chương trình xử lý yêu cầu (sử dụng cụm từ khóa) và hiển thị danh sách các tài liệu có chứa cụm từ khóa này. Vì thông tin được chứa trong chỉ mục có cấu trúc nên việc xử lý truy vấn nhanh hơn nhiều (hàng chục và hàng trăm lần!) so với trường hợp tìm kiếm trực tiếp (tài liệu được chọn không phải bằng cách tìm kiếm qua tệp mà bằng cách phân tích thông tin văn bản trong chỉ mục).

Chương trình hiển thị các tài liệu tìm thấy trong danh sách kết quả theo mức độ liên quan - sự tuân thủ của tài liệu với văn bản truy vấn. Tất nhiên, trong các công nghệ khác nhau, có những phương pháp khác nhau để tìm kiếm và xác định mức độ liên quan của một tài liệu (số lần “xuất hiện” của một từ và tần suất nhắc đến nó trong tài liệu, tỷ lệ của các tham số này trên tổng số từ). trong tài liệu, khoảng cách giữa các từ của cụm từ truy vấn trong các tệp được tìm kiếm, v.v.). Dựa trên các tham số này, "trọng lượng" của tài liệu được xác định và tùy thuộc vào nó, một tệp cụ thể sẽ xuất hiện trong danh sách kết quả ở một vị trí nhất định. Trong trường hợp tìm kiếm trên Internet, tình hình còn phức tạp hơn. Thật vậy, trong trường hợp này, nhiều yếu tố khác phải được tính đến (Xếp hạng Trang của Google là một ví dụ về điều này). Nhưng đây là chủ đề cho một bài viết riêng nên chúng tôi sẽ không đề cập đến việc đánh giá các công cụ tìm kiếm trên Internet.

Tài liệu này kiểm tra khả năng của một số chương trình tìm kiếm phổ biến có cả tốc độ khá và chức năng tốt. Nhưng khoe khoang trong tờ rơi là một chuyện, nhưng đứng dưới sự soi mói của chuyên gia lại là chuyện khác. Và không còn chuyên gia nữa, không kém một văn phòng đầy những người thích mày mò phần mềm để có thể sử dụng được. Một bộ chương trình được cài đặt trên máy tính thử nghiệm (Athlon 2,2 MHz, RAM 1 GB, ổ cứng IDE 160 GB Seagate 7200 vòng/phút và Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, Máy tính để bàn ISYS. Đối với các thử nghiệm, cơ sở dữ liệu văn bản gồm các tài liệu đã được biên soạn ở định dạng doc, txt và html với tổng kích thước không hơn không kém mà là 20 gigabyte. Một nhóm đồng chí dưới sự lãnh đạo của người đầy tớ khiêm tốn của bạn đã thử nghiệm, so sánh và chia sẻ những cảm nhận chủ quan của mình về từng phần mềm. Đọc bản tóm tắt các phát hiện dưới đây. Máy tính để bàn dtSearch

Một chương trình mà theo các nhà phát triển tuyên bố là công cụ tìm kiếm nhanh nhất, tiện lợi nhất và tốt nhất. Nói chung, giống như những người khác trong bài đánh giá này. Giao diện của dtSearch khá đơn giản nhưng một số cửa sổ hoặc tab có phần quá tải các thành phần nên có vẻ khó sử dụng. Nhưng trên thực tế không có khó khăn gì đặc biệt. Điểm thực sự khó chịu duy nhất là phần mềm không hỗ trợ tiếng Nga (mặc dù thực tế là chương trình có thể tìm kiếm tài liệu bằng nhiều ngôn ngữ nhưng giao diện của nó chỉ có tiếng Anh).

Nhưng dtSearch là một trong số ít chương trình có thể lập chỉ mục các trang web theo “độ sâu” do người dùng chỉ định (mặc dù có tính đến việc “mua thêm” bộ tiện ích bổ sung dtSearch Spider). Điều này ngoài việc hỗ trợ các tệp đĩa có định dạng văn bản và email khác nhau từ hộp thư Outlook. Đồng thời, chương trình không thể hoạt động với cơ sở dữ liệu, vốn là một thứ ngon lành đối với các công cụ tìm kiếm do khối lượng thông tin lớn chứa trong đó và sự phân bố rộng rãi của chúng trong các công ty và do đó trong các mạng công ty. Tốc độ lập chỉ mục các tài liệu dtSearch hóa ra ở mức phù hợp. Nhìn về phía trước, tôi sẽ nói rằng chương trình này đã xử lý việc lập chỉ mục một lượng thông tin nhất định ngang hàng với một đối thủ cạnh tranh khác - iSYS - và chia sẻ vị trí thứ hai với nó trong danh sách các hệ thống nhanh nhất. dtSearch đã lập chỉ mục kiểm tra 20 gigabyte thông tin trong 6 giờ 13 phút, tạo chỉ mục 7,9 GB cho các nhu cầu tìm kiếm tiếp theo.

Về khả năng tìm kiếm, chúng ở mức phù hợp. Đầu tiên, dtSearch có tính năng tìm kiếm hình thái (tìm kiếm một từ ở tất cả các dạng hình thái của nó). Tận dụng cơ hội này, bạn sẽ giải phóng bản thân khỏi những suy nghĩ như “trong trường hợp nào một từ nhất định được sử dụng trong tài liệu tôi cần?” Việc sử dụng tìm kiếm hình thái hầu như luôn hợp lý, vì vậy nó phải có mặt trong bất kỳ công cụ tìm kiếm chuyên nghiệp nào.

Tìm kiếm bằng âm thanh là một tính năng không chuẩn ngay cả đối với các công cụ tìm kiếm chuyên nghiệp. Bản chất của nó là chương trình sẽ tìm kiếm những từ có âm thanh giống với từ bạn nhập vào. Và điều tuyệt vời nhất là chức năng này cũng hoạt động với tiếng Nga! Ví dụ: khi bạn nhập từ "tai" vào truy vấn tìm kiếm, kết quả là bạn sẽ thấy không chỉ các từ "tai" mà còn cả "tai".

Tìm kiếm có sửa lỗi là một chức năng rất quan trọng. Nó được sử dụng để tìm kiếm các từ có lỗi cú pháp - ví dụ: đây có thể là lỗi chính tả hoặc lỗi trong tài liệu thu được bằng hệ thống nhận dạng ký tự. Một ví dụ đơn giản - bạn đang tìm kiếm bàn phím chữ. Một số tài liệu có chứa từ “bàn phím”, rõ ràng thực chất đây là từ “bàn phím”, người ta chỉ gõ nhầm khi gõ mà thôi. Vì vậy, tìm kiếm sửa lỗi sẽ phát hiện và đưa tài liệu có từ "bàn phím" vào kết quả. Ngoài ra còn có một cài đặt trong dtSearch cho phép bạn xác định mức độ các ký tự có thể bị lỗi.

Tìm kiếm bằng từ đồng nghĩa. Tính năng này sử dụng danh sách các từ đồng nghĩa cho nhiều từ khác nhau. Vì vậy, ví dụ, bằng cách nhập từ “nhanh”, chương trình cũng sẽ tìm thấy các từ “tốc độ cao” và các từ khác là từ đồng nghĩa với từ “nhanh”, tất nhiên nếu chúng có trong danh sách các từ đồng nghĩa . Danh sách từ đồng nghĩa làm sẵn không được cung cấp cùng với chương trình dtSearch, tuy nhiên, bạn có thể sử dụng danh sách trên Internet (theo đó, cần có kết nối, không phải lúc nào cũng thuận tiện) hoặc bạn có thể tạo danh sách từ đồng nghĩa của riêng mình .

Ngoài các khả năng được liệt kê, dtSearch có thể tìm kiếm bằng cách sử dụng các cụm từ bao gồm các từ được kết nối bằng các phép toán logic. Mỗi từ trong truy vấn có thể được gán “trọng số” riêng, tức là tầm quan trọng. Một lựa chọn hữu ích là sử dụng từ điển gồm những từ không quan trọng để không tính đến chúng khi tìm kiếm, nhưng từ điển này cũng trống và bạn sẽ phải tự điền vào.

Tiếp theo, hãy xem khả năng của chương trình khi làm việc trên mạng. Trên thực tế, dtSearch không cung cấp bất kỳ khả năng cụ thể nào để làm việc với mạng. Tuy nhiên, hoàn toàn có thể sử dụng nó trực tuyến. Ngoài ra, bạn có thể tạo một số loại chỉ mục và đặt nó vào thư mục công khai (được chia sẻ). Bản thân chương trình có thể được cài đặt trên máy tính của mỗi người dùng hoặc cũng có thể được đặt trong một thư mục mở để truy cập công khai và các phím tắt có thể được tạo theo cách đặc biệt cho từng người dùng riêng biệt, sử dụng các tham số dòng lệnh, mục đích của nó được mô tả trong tệp trợ giúp được cung cấp cùng với chương trình. Cũng có thể tự động cài đặt chương trình trên mạng bằng tệp MSI. Điều này sẽ tính đến cài đặt cho từng người dùng được kết nối.

Nhìn chung, đây là một chương trình tốt thuộc danh mục công cụ tìm kiếm chuyên nghiệp. Nó có thể đủ điều kiện để được xếp hạng tốt, nhưng việc giành được sự tin tưởng và tôn trọng từ người dùng có thể không dễ dàng đối với dtSearch do một số yếu tố nhất định (không phải mọi thứ đều mượt mà với giao diện, người dùng Nga bị thiếu hụt, không có tính năng sáng giá nào khi làm việc với mạng) . Đối với việc tìm kiếm tài liệu trực tiếp, chương trình không gặp vấn đề gì với văn bản tiếng Nga. Vì không có cái nào có hình thái được khai báo hoặc tìm kiếm mờ. Hệ thống đã tìm thấy khá đầy đủ các tài liệu cần thiết bằng cách truy vấn một từ đơn giản và bằng cách sử dụng một vài đoạn văn hoặc một tài liệu làm cụm từ khóa.

Trang web chính thức:
Kích thước phân phối: 23 Mb Bloodhound Prof Deluxe

Dựa vào tên, bạn có thể đoán rằng chương trình này có hỗ trợ tiếng Nga. Điều này đã tốt đẹp rồi. Về giao diện thì nhìn chung có phần khác lạ nhưng nhìn bề ngoài thì rất hấp dẫn. Một điều nữa là sự tiện lợi. Một tiêu chí rất gây tranh cãi, nhưng có lẽ, giải pháp nhiều cửa sổ không phải là lựa chọn thành công nhất (yêu cầu được nhập vào một cửa sổ, kết quả được hiển thị trong một cửa sổ khác, v.v.).

Snoop sử dụng các chỉ mục giống nhau để thực hiện tìm kiếm nhanh nhưng việc lập chỉ mục chậm hơn nhiều so với các chương trình khác. Điều này rất lạ, đặc biệt khi xét đến khả năng xử lý truy vấn tìm kiếm của nó rất yếu và do đó cấu trúc chỉ mục không phức tạp. Rất có thể, điều này là do các thuật toán chưa được tối ưu hóa. Chương trình này hóa ra lại đứng ngoài cuộc rõ ràng về tốc độ lập chỉ mục và tìm kiếm: thời gian tạo chỉ mục dài hơn sáu lần so với cùng một dtSearch và iSYS. Việc lập chỉ mục 20 gigabyte văn bản cho chó săn dẫn đến 38 giờ 46 phút làm việc. Và “vùng tìm kiếm” được tạo trên ổ cứng có cùng kích thước với dữ liệu gốc với một điểm trừ nhỏ - 19 gigabyte.

Bloodhound có thể được trình bày như một giải pháp thay thế cho tìm kiếm tiêu chuẩn trong Windows; Thực tế là nhiệm vụ chính của Snooper là tìm kiếm tệp đơn giản nhất được biểu thị không chỉ bằng số lượng nhỏ các chức năng phân tích văn bản của truy vấn tìm kiếm và tìm kiếm nâng cao theo thuộc tính tệp mà thậm chí bằng cửa sổ kết quả cung cấp liên kết trực tiếp đến các tập tin được tìm thấy cũng như các thư mục chứa các tập tin này. Cửa sổ kết quả không có nhiều thông tin theo nghĩa là bạn chỉ có thể đọc toàn bộ tệp tìm thấy bằng cách chạy nó, nghĩa là nó không có trình xem tệp tích hợp. Nhưng một đoạn trích từ tệp nơi tìm thấy từ được tìm thấy được hiển thị nói chung, sơ đồ hiển thị này rất gợi nhớ đến các công cụ tìm kiếm trên Internet.

Nói về các khả năng cụ thể để xử lý truy vấn tìm kiếm, cần lưu ý rằng không có thứ gọi là “văn bản tìm kiếm”; mức tối đa có thể tìm kiếm là một cụm từ, nếu chỉ vì không có trường nhập văn bản nhiều dòng. Tuy nhiên, bạn có thể phân tích cụm từ đã nhập và Snoop cung cấp cho chúng ta bộ tìm kiếm tiêu chuẩn tại đây: các thao tác logic, tìm kiếm mặt nạ và tìm kiếm trích dẫn... không nhiều. Chương trình này chứa một số kiến ​​thức cơ bản về tìm kiếm hình thái, nhưng có lẽ nó thô sơ đến mức rất có thể cản trở hoạt động chính xác (trong quá trình thử nghiệm, nhiều lỗi sử dụng hình thái không chính xác đã được nhận thấy).

Nhưng chương trình cho phép bạn chỉ định các thuộc tính tệp khi tìm kiếm (ngày tài liệu, tên tệp, tên thư mục) và trong các truy vấn này, bạn cũng có thể sử dụng cùng một bộ tìm kiếm. Bạn cũng có thể tìm kiếm các chữ cái bằng cách chỉ định các tham số (Từ, Chủ đề..., v.v.).

Vì vậy, chúng tôi đã tự mình tìm ra điều gì thú vị về chương trình mà nó đã nhận được rất nhiều giải thưởng, theo thông tin từ trang web chính thức? Thật khó để nói nó có gì đặc biệt; rất có thể, giao diện Bloodhound rất hấp dẫn (chính xác là về hình thức, chưa kể đến khả năng sử dụng).

Các thao tác với chỉ mục rất chuẩn; một tính năng hay là khả năng cập nhật chỉ mục theo lịch trình. Ngoài ra, các chỉ mục cũng có thể được sử dụng trực tuyến. Từ bây giờ chúng tôi cần thêm chi tiết.

Bất chấp tính nguyên thủy của các truy vấn tìm kiếm, chương trình có thể được sử dụng để tìm kiếm các tệp, do đó việc sử dụng nó có thể hợp lý trong các mạng. Mặc dù đây là một bước tiến dài, vì trong một mạng lớn, ưu tiên hàng đầu là tìm kiếm dữ liệu nhanh chóng bằng các truy vấn tìm kiếm phức tạp do lượng thông tin khổng lồ - và rõ ràng có vấn đề về tốc độ tìm kiếm và chương trình. Tôi phải nói rằng công việc với mạng lưới tại Izhishika đã được thực hiện đúng như mong đợi. Một ứng dụng riêng biệt được thiết kế dành riêng cho việc này - Bloodhound Server. Nó hoạt động theo cách tương tự như Snooper (họ có một công cụ tìm kiếm), chỉ dành cho các tài liệu nằm trên máy chủ trung tâm hoặc trên các tài nguyên được chia sẻ trên mạng công ty. Snooper Server tạo các chỉ mục mới trên các tài nguyên được chia sẻ hoặc sử dụng các tài nguyên đã tạo trước đó. Bất kỳ người dùng nào của mạng công ty đều có thể kết nối với Máy chủ tìm kiếm và sử dụng nó để truy cập bất kỳ tài liệu nào (nằm trong chỉ mục hiện tại) bằng trình duyệt Internet. Đồng ý, sơ đồ này cực kỳ tiện lợi: hóa ra các tệp trên mạng của chính bạn có thể được tìm kiếm giống như cách tìm kiếm thông tin trên Internet thông qua Google, chẳng hạn như.

Đánh giá tất cả những ưu điểm và nhược điểm của chương trình này, kết luận cho thấy rằng khả năng của nó rất có thể là không đủ đối với mạng công ty (mặc dù tổ chức làm việc với mạng tốt), nhưng đối với máy tính gia đình hoặc thậm chí đối với mạng gia đình thì điều đó là không thể. , về nguyên tắc, , nó có thể xuất hiện. Mặc dù tốc độ làm việc cũng như khả năng tìm kiếm đều không mang lại sự lạc quan...

Trang web chính thức bằng tiếng Nga:
Kích thước phân phối: 6 MbGoogle Desktop Search + GDS Enterprise

Tất nhiên, chúng tôi không thể bỏ qua một nhà phát triển nổi tiếng như vậy. Cái tên Google đã nói lên rất nhiều điều. Những người đã sử dụng công cụ tìm kiếm Internet mạnh mẽ nhất trong nhiều năm chắc chắn sẽ quyết định cài đặt công cụ tìm kiếm cụ thể này trên máy tính của họ mà không nghi ngờ gì. Hãy nghĩ xem: Google trên máy tính ở nhà của bạn! Tuy nhiên, không nhượng bộ trước những hành động khiêu khích với một thương hiệu được quảng bá rộng rãi, chúng ta hãy thử xem xét một cách tỉnh táo và quan trọng nhất một cách khách quan là khả năng của công cụ tìm kiếm “máy tính để bàn” của Google.

Điều đầu tiên khiến bạn chú ý là việc thiếu lớp vỏ riêng cho chương trình. Google Desktop Search vẫn nằm trong cửa sổ trình duyệt, tương ứng, toàn bộ giao diện của phiên bản dành cho máy tính để bàn được kế thừa từ phần mềm từ người anh em Internet cũ hơn của nó. Điều này tốt hay xấu vẫn là một điểm cần tranh luận: một số người thích sự tối giản trong thiết kế của công cụ tìm kiếm này, trong khi những người khác muốn xem một ứng dụng hoàn chỉnh với đủ loại nút, v.v.

Điều gì thu hút sự chú ý của bạn ngay sau khi thiết kế? Và thực tế là chính Google Desktop Search này bắt đầu lập chỉ mục mọi thứ trên máy tính mà không cần bất kỳ yêu cầu nào! Và điều thú vị nhất là không thể chọn đường dẫn lập chỉ mục bằng Google Desktop Search. Bạn sẽ phải tải xuống một chương trình riêng (TweakGDS), chương trình này sẽ cho phép bạn mở rộng phần nào cài đặt Google Desktop, bao gồm cả việc chỉ định các vị trí cần thiết để lập chỉ mục. Mặc dù, vào thời điểm bạn tìm ra tất cả những điều này, nó sẽ lập chỉ mục cho một ổ cứng tiêu chuẩn, vì vậy cài đặt này có nhiều khả năng cần thiết hơn khi làm việc với lượng lớn dữ liệu, điều này rất quan trọng khi được sử dụng trong mạng công ty (Phiên bản doanh nghiệp) . Tuy nhiên, không phải thực tế là sau khi tải xuống TweakGDS, vấn đề của bạn sẽ được giải quyết. Rốt cuộc, nó yêu cầu Microsoft .NET Framework và Microsoft Scripting Runtime để hoạt động. Vâng... việc cài đặt, cũng như quyền truy cập vào cài đặt, có thể đã được thực hiện đơn giản hơn, mặc dù các nhà phát triển có thể hiểu: tại sao phải viết nội dung mới khi có một công cụ tìm kiếm được tạo sẵn, chuyển nó sang máy tính cục bộ và để người dùng “thưởng thức” và một cái tên nổi tiếng sẽ tạo nên một kiệt tác khác từ “cái này”. Nào, hãy kết thúc sự lạc đề trữ tình này và chuyển sang tìm kiếm.

Đối với việc phân tích truy vấn tìm kiếm và cung cấp kết quả, mọi thứ ở đây hoàn toàn giống với Google trên Internet: cùng một hệ thống hiển thị kết quả, cùng một bộ hoạt động logic tiêu chuẩn cho truy vấn tìm kiếm. Nói chung, Google Desktop Search, giống như chương trình trước, chỉ nhằm mục đích tìm kiếm các tệp - tất nhiên, nó không có trình xem nội bộ cho các tệp này. Số lượng định dạng tệp được Google Desktop Search hỗ trợ là khá đủ và thật tuyệt khi nó tìm kiếm các trang Internet đã truy cập, lấy dữ liệu từ bộ đệm. Tốc độ tìm kiếm và lập chỉ mục khá chấp nhận được. Đúng, để sử dụng tại nhà. Google Desktop Search đã xử lý được 20 gigabyte văn bản ấn tượng trong 8 giờ 17 phút. Việc dành nhiều ngày để xử lý thông tin từ mạng công ty của một doanh nghiệp lớn là điều không phải quản trị viên hệ thống nào cũng mong muốn thực hiện. Về mặt tích cực: kích thước của chỉ mục đã tạo ở cùng mức (4,5 GB) với một công cụ tìm kiếm khác đã được thử nghiệm trong bài đánh giá này - SearchInform.

Ưu điểm lớn (hoặc bất lợi - do bạn quyết định) của Google Desktop Search là nó hỗ trợ các plugin, có thể thay đổi nhiều để tốt hơn. Một điều nữa là việc kết nối các plugin và thiết lập chúng làm phức tạp nhiệm vụ cài đặt công cụ tìm kiếm đến mức bạn bắt đầu tự hỏi liệu tất cả những điều này có cần thiết hay không khi bạn có thể cài đặt một chương trình bình thường, đầy đủ trong đó mọi thứ sẽ có mặt. Cuối cùng, để sử dụng từng tính năng, bạn sẽ phải cài đặt một plugin mới. Ngay cả để chương trình hoạt động hoàn toàn với các kho lưu trữ, cần có một tiện ích riêng. Thật hấp dẫn và quyến rũ khi tất cả các mô-đun bổ sung này đều miễn phí. Tuy nhiên, nếu bạn không tính đến phiên bản dành cho máy tính để bàn của công cụ tìm kiếm, thì cấu hình có thẩm quyền của GDS Enterprise có thể không nằm trong khả năng của bạn - xét cho cùng, không phải vô cớ mà các chuyên gia của Google cung cấp dịch vụ của họ để thiết lập công cụ tìm kiếm của riêng họ. phần mềm cho mạng của bạn chỉ với 10.000 USD.

Nếu bạn thực hiện quy trình thiết lập và cài đặt (hoặc trả 10.000 USD cho nhóm phản hồi nhanh từ Google), bạn sẽ hiểu rằng độ phức tạp của quá trình cài đặt được bù đắp nhiều hơn bằng các cài đặt rất linh hoạt khi sử dụng trong mạng công ty. Một khía cạnh quan trọng của việc sử dụng Google Desktop trên mạng công ty là việc sử dụng các chính sách nhóm, giúp có thể đặt cài đặt cho từng người dùng.

Tóm lại, cách sử dụng hợp lý nhất cho chương trình này là máy tính ở nhà hoặc cơ quan. Xét cho cùng, đối với một máy tính thông thường, chỉ cần cài đặt chương trình là đủ - nó sẽ tự thực hiện phần còn lại (nó thậm chí sẽ không hỏi bạn bất cứ điều gì).

Tuy nhiên, Google Desktop Search Enterprise sẽ được chấp nhận trong trường hợp có nhu cầu cấp thiết về cấu hình chính sách mạng linh hoạt để sử dụng công cụ tìm kiếm, trong khi khả năng xử lý các truy vấn tìm kiếm sẽ xếp ở vị trí thứ hai về tầm quan trọng và thời gian (hoặc tiền bạc). ) dành cho việc thiết lập chương trình sẽ ở vị trí đầu tiên.

Trang web chính thức:
Kích thước phân phối bao gồm TweakGDS: 1,2 MbCopernic Desktop Search

Click vào hình để phóng to

Giao diện chương trình gợi lên những cảm xúc cực kỳ tích cực - mọi thứ đều được thực hiện theo các tiêu chuẩn được chấp nhận chung, không có gì thừa thãi, nói tóm lại là một thiết kế dễ chịu. Đối với người mới bắt đầu, việc hiểu giao diện Copernic Desktop Search sẽ rất dễ dàng. Mặc dù có phần khó hiểu khi các nhà thiết kế rõ ràng đã tạo ra giao diện chương trình có tính đến thực tế là chương trình sẽ hoạt động theo chủ đề Windows XP tiêu chuẩn. Khi sử dụng chủ đề cổ điển, chương trình trông không đẹp lắm. Nhưng đây là vấn đề về hương vị nhiều hơn.

Ở lần khởi chạy đầu tiên, chương trình sẽ nhắc bạn tạo chỉ mục để tìm kiếm. Có vẻ hơi bất thường là sau khi chọn các thư mục để lập chỉ mục, chương trình không đề nghị nhấn bất kỳ nút nào, chẳng hạn như "Bắt đầu lập chỉ mục" và việc lập chỉ mục không tự động bắt đầu, chỉ khi đó người ta mới nhận thấy rằng Copernic đang cố gắng bắt đầu lập chỉ mục trong khi máy tính đã nhàn rỗi. Bạn sẽ phải tìm hiểu sâu hơn một chút về các tùy chọn của chương trình để định cấu hình mọi thứ đúng cách. Cần lưu ý rằng có nhiều khả năng khá rộng để thiết lập tạo chỉ mục tự động: bộ lập lịch tích hợp, khả năng lập chỉ mục trong khi máy tính không hoạt động, ở chế độ nền, với mức độ ưu tiên thấp. Lập chỉ mục không quá nhanh - 10 giờ 51 phút - tốc độ này chậm hơn so với các công cụ tìm kiếm khác (ngoại trừ Isle of Bloodhound, nhưng Copernic vẫn nhanh hơn rất nhiều so với sự phát triển của iSleuthHound Technologies.

Bây giờ về cấu trúc của chỉ mục. Nói chung, không có gì đặc biệt về nó. Có thể chọn loại tệp, cả ở dạng chung và chi tiết. Nghĩa là, ban đầu bạn có thể chọn những gì bạn muốn lập chỉ mục - Tài liệu, Hình ảnh, Video, Âm nhạc. Trên tab khác của cửa sổ tùy chọn, bạn sẽ có thể chọn các loại tệp cụ thể theo phần mở rộng. Ngoài ra, bạn có thể định cấu hình chỉ mục để, ví dụ: ảnh có kích thước nhỏ hơn 16x16 không được lập chỉ mục hoặc các tệp âm thanh có độ dài dưới 10 giây không được lập chỉ mục. Ngoài việc lập chỉ mục các tệp từ các thư mục, Copernic có thể làm việc với email và danh bạ từ sổ địa chỉ của Microsoft Outlook và Microsoft Outlook Express, đồng thời có thể lập chỉ mục Mục ưa thích và Lịch sử từ Internet Explorer.

Về khả năng tìm kiếm, ở đây họ rất yếu. Trong quá trình thử nghiệm, người ta thậm chí còn tiết lộ rằng chương trình không tìm kiếm tài liệu ở định dạng txt và html bằng tiếng Nga, cho phép bạn chỉ tìm kiếm chúng theo tiêu đề chứ không phải theo nội dung. Điều duy nhất mà chương trình cung cấp để cải thiện hiệu quả tìm kiếm là việc sử dụng một bộ thao tác logic tiêu chuẩn và thậm chí sau đó, tính năng này đã được phát hiện bằng thực nghiệm vì nó không được ghi lại. Nhân tiện, sự trợ giúp của chương trình cũng không ổn - nó chỉ có sẵn qua Internet, điều này, bạn thấy đấy, rất bất tiện và không có quá nhiều thông tin trợ giúp trên Internet. Rõ ràng, các nhà phát triển đã quyết định rằng giao diện đơn giản của chương trình không ngụ ý sự hiện diện của trợ giúp thông thường. Tiếp tục cuộc trò chuyện về khả năng tìm kiếm, cần lưu ý rằng, mặc dù phân tích truy vấn yếu, chương trình cung cấp một hệ thống tìm kiếm thú vị - người dùng có thể chọn loại tệp (hình ảnh, video, nhạc, v.v.), nhập tìm kiếm truy vấn và chọn các thuộc tính cụ thể cho loại tệp đã chọn. Ví dụ: đối với tệp âm thanh, đây có thể là các giá trị từ thẻ mp3 (nghệ sĩ, album, ngày tháng, v.v.), đối với hình ảnh, bạn có thể chọn kích thước của chúng (theo độ phân giải), nói chung, mỗi loại đều có cài đặt riêng. Sau khi tìm kiếm một loại tệp cụ thể, chương trình sẽ hiển thị một danh sách rất nhiều thông tin trong cửa sổ kết quả và nếu yêu cầu của bạn bao gồm các loại tệp khác, bạn có thể mở chúng bằng cách nhấp vào một liên kết cụ thể.

Riêng biệt, điều đáng nói là cửa sổ hiển thị kết quả. Bên dưới danh sách các tệp được tìm thấy, nội dung của các tệp này được hiển thị (sơ đồ tương tự thường được sử dụng trong ứng dụng email). Đúng, việc xem văn bản chỉ có thể được thực hiện ở định dạng gốc và không có chế độ hiển thị văn bản thuần túy, điều này không phải lúc nào cũng thuận tiện vì việc mở tài liệu trong trường hợp này sẽ mất nhiều thời gian hơn. Tuy nhiên, vì Copernic có thể tìm kiếm hình ảnh và âm nhạc nên bạn có thể xem các tệp đa phương tiện này.

Các nguyên tắc hoạt động cơ bản của chương trình này đã được mô tả, bây giờ hãy xem Copernic Desktop Search có thể mang lại cho chúng ta những gì khi làm việc với mạng... Về nguyên tắc, bạn có thể xem trong một thời gian rất dài, nhưng bạn sẽ khó có thể nhìn thấy gì . Nói cách khác, chương trình này không nhằm mục đích dựa trên mạng. Copernic Desktop Search là một công cụ tìm kiếm dành riêng cho gia đình.

Rõ ràng, ứng dụng duy nhất (hợp lý nhất) của chương trình này là máy tính ở nhà. Tại đây, nó sẽ hoàn toàn đáp ứng được tất cả các truy vấn tìm kiếm đơn giản của người dùng bao gồm một hoặc hai từ, sẽ tìm thấy thông tin cần thiết cũng như phân chia tìm kiếm theo loại tệp và hỗ trợ các tệp đa phương tiện cùng với lập chỉ mục nền ở chế độ ưu tiên thấp, cùng với tính năng dễ chịu giao diện, chỉ tạo sức mạnh cho chương trình để lấy được lòng tin của những người dùng thiếu kinh nghiệm.

Trang web chính thức
Kích thước phân phối: Máy tính để bàn 2,6 MbISYS

Click vào hình để phóng to

Một chương trình rất mạnh mẽ. Xét về mức độ trang bị với đủ loại chức năng, nó gần giống với hệ thống tìm kiếm SearchInform tiếp theo trong danh sách. Hơn nữa, kích thước của tệp cài đặt là hơn 40Mb! Thật khó để nói những gì có thể được nén vào các kích thước như vậy, bởi vì cùng một SearchInform, với chức năng tương tự, chiếm 15Mb.

Quá trình cài đặt ở đây cũng không mấy dễ chịu, hay đúng hơn là thậm chí không phải quá trình cài đặt. Ngay cả trước khi tải chương trình xuống, bạn sẽ được yêu cầu đăng ký, nếu không thì không có cách nào. Tiếp theo là giao diện. Nó được làm rất độc đáo, không có gì quá bắt mắt, tuy nhiên, đây là ấn tượng của một người đã phần nào quen với nó. Sẽ không dễ dàng cho người mới bắt đầu tìm ra vị trí và cái gì, nhấp vào đâu và cuối cùng là tìm kiếm ở đâu. Bạn nên đọc phần trợ giúp trước khi bắt đầu công việc - bạn sẽ tiết kiệm được rất nhiều công sức và thời gian. Thêm vào mọi thứ khác là chương trình hoàn toàn không hỗ trợ tiếng Nga. Không tốt. Ngoài ra, các cửa sổ ở đây không bị quá tải về bộ điều khiển, nhưng chúng tôi đã phải trả giá cho việc này bằng nhiều mô-đun và việc sử dụng các cửa sổ bổ sung. Ví dụ: truy vấn tìm kiếm được nhập bằng cách khởi chạy một chương trình và việc quản lý chỉ mục được thực hiện bằng chương trình khác. Truy vấn tìm kiếm cũng được nhập vào đây trong các cửa sổ bật lên riêng biệt. Thật khó để nói cái nào tốt hơn - giao diện quá tải hay nhiều cửa sổ phổ biến;

Khi nói đến việc tạo chỉ mục, chương trình cung cấp các tính năng để đơn giản hóa quá trình thiết lập các tùy chọn cho chỉ mục mới. Các tính năng này bao gồm một số mẫu tạo sẵn để tạo chỉ mục cho thư mục “Tài liệu của tôi”, “Thư”, “Thư và Tài liệu”, “Thư mục cụ thể”, “Thư mục có lựa chọn loại tệp”, v.v. tạo chỉ mục ở giai đoạn đầu tiên. Tiện ích để làm việc với các chỉ mục không có giao diện tốt, hơi phức tạp (thành thật mà nói, đây là một đánh giá rất chủ quan), tuy nhiên, nếu bạn nhìn vào nó, nó cung cấp nhiều tùy chọn hữu ích và nói chung , việc sử dụng nó không gây nhiều khó khăn. ISYS Desktop có thể lập chỉ mục dữ liệu từ nhiều nguồn dữ liệu khác nhau và cũng cung cấp nhiều cài đặt linh hoạt cho việc lập chỉ mục đó. Các tính năng lập chỉ mục bổ sung bao gồm: hỗ trợ SQL, FTP, TRIM Context, WORLDOX 2002, tập lệnh. Khi tạo chỉ mục, nếu bạn chọn mục "Thư mục có lựa chọn loại tệp", bạn có cơ hội chọn loại tệp để lập chỉ mục theo cách thủ công (theo tiện ích mở rộng). Phải nói rằng đơn giản là có một số lượng lớn các loại tệp được hỗ trợ, nhưng bạn sẽ không thể thêm loại (tiện ích mở rộng) của riêng mình vào danh sách hiện có. Bạn cũng có thể lưu ý sự hiện diện của bộ lập lịch lập chỉ mục. Việc tạo chỉ mục và xử lý 20 gigabyte thông tin đã khiến ISYS Desktop mất 6 giờ 13 phút, cuối cùng hiển thị thời gian phù hợp và kích thước của tệp đã tạo - 7,9 GB.

Khả năng tìm kiếm của chương trình này khá tốt. Những gì được sử dụng trong ISYS mạnh hơn nhiều so với sự hỗ trợ thông thường cho các hoạt động logic. Trong số các khả năng tìm kiếm nâng cao, chương trình cung cấp việc sử dụng các từ đồng nghĩa và bộ lọc sắp xếp (theo đường dẫn, tên và ngày tạo tệp). Tập hợp các toán tử logic rộng hơn một chút so với tập hợp tiêu chuẩn. Ngoài các thao tác logic, chương trình cho phép bạn làm việc với nhiều toán tử khác, về nguyên tắc, có thể thay thế một số loại tìm kiếm, ví dụ: tìm kiếm bằng phân tích cú pháp có thể được thay thế hoàn toàn bằng cách sử dụng các toán tử đặc biệt. Tôi rất ngạc nhiên khi chương trình không có tính năng tìm kiếm bằng hình thái học. Đây là một thiếu sót nghiêm trọng vì hiệu quả tìm kiếm được cải thiện rất nhiều khi sử dụng phân tích hình thái. Ngoài ra, không có danh sách các từ quan trọng mà có một danh sách đầy đủ các từ không quan trọng. Cũng nêu rõ các chức năng tìm kiếm như "tìm kiếm gần đúng" và "phân tích heuristic".

ISYS cung cấp sự lựa chọn của một số loại truy vấn tìm kiếm, cụ thể là các loại trực quan. Điều này được thực hiện bằng cách sử dụng các loại cửa sổ khác nhau để nhập truy vấn tìm kiếm, tuy nhiên, trên thực tế, không một cửa sổ nào cho phép sử dụng các công nghệ khác ngoài những công nghệ được liệt kê ở trên.

Kết quả tìm kiếm rất giàu thông tin và được hiển thị dưới dạng danh sách các tài liệu được sắp xếp theo mức độ liên quan. Bản xem trước của tài liệu đã chọn được hiển thị bên dưới. Không giống như Copernic Desktop Search, bản xem trước ở đây chỉ khả dụng ở dạng văn bản thuần túy; không thể hiển thị tài liệu ở định dạng gốc, có thể là Word, Html hoặc PDF, mặc dù về nguyên tắc, điều này không quá quan trọng. Chương trình cho phép bạn chia các tài liệu tìm thấy thành các nhóm theo tiêu chí nhất định (theo mặc định chúng được chia theo mức độ liên quan). Bạn cũng có thể xem các tài liệu đã tìm thấy bằng cách chọn các thư mục riêng lẻ (điều này thuận tiện khi kết quả tạo ra số lượng tài liệu rất lớn).

Việc sử dụng chương trình trên mạng công ty cũng rất hợp lý vì nó mang lại cơ hội tốt để tổ chức tìm kiếm mạng. Hệ thống tìm kiếm dựa trên việc tạo ra một chỉ mục công khai chứa dữ liệu được lập chỉ mục từ các tài nguyên trực tuyến có sẵn công khai.

Trên thực tế, chương trình từ ISYS rất đáng được quan tâm, ít nhất là làm quen với nó. Chương trình này là một dự án trưởng thành với một số lượng lớn các chức năng (tất nhiên không phải lúc nào và không phải tất cả mọi người đều cần chúng, nhưng vẫn vậy). Vẫn chưa xác định được khả năng chương trình sẽ thấy một số cải tiến về mặt xử lý truy vấn tìm kiếm, nhưng hiện tại, nó có thể được khuyến nghị sử dụng hầu như phổ biến. Và do nó vẫn còn quá nặng đối với hệ thống gia đình, nên nơi chính để lắp đặt nó là mạng công ty.

Trang web chính thức:
Kích thước phân phối: 40 MbSearchInform

Click vào hình để phóng to

Có lẽ không đáng để bắt đầu ngay với phần mô tả về giao diện SearchInform. Trước tiên chúng ta nên mô tả quá trình cài đặt, hay đúng hơn là một trong những chi tiết của nó: bạn không thể cài đặt chương trình nếu không có kết nối Internet. Thực tế là trước lần ra mắt đầu tiên, chương trình yêu cầu người dùng đăng ký (miễn phí) và gửi tất cả dữ liệu đã nhập đến máy chủ. Rõ ràng, các nhà phát triển đã phải thực hiện các biện pháp như vậy trong cuộc chiến chống vi phạm bản quyền, nhưng điều này không có tác động tích cực đến việc cài đặt dễ dàng.

Giao diện chương trình được thiết kế tuân thủ tất cả các quy tắc được chấp nhận chung, tuy nhiên, thoạt nhìn, nó hơi cồng kềnh. Sử dụng chương trình lần đầu tiên, có vẻ như nó quá phức tạp, đôi khi không dễ nhớ tùy chọn mong muốn nằm ở menu nào hoặc tab nào, tuy nhiên, sử dụng lâu hơn, giao diện không còn phức tạp đến mức khủng khiếp nữa. . Điều chính là đọc chứng chỉ đầu tiên.

Sau khi hiểu giao diện một chút, bạn có thể bắt đầu tạo chỉ mục. Bản thân quá trình này rất đơn giản và tốc độ lập chỉ mục, thậm chí bằng mắt, cao hơn đáng kể so với tất cả các công cụ tìm kiếm khác trong bài đánh giá. Những con số kiểm tra rõ ràng cho thấy SearchInform nhanh gấp đôi dtSearch và iSYS về tốc độ lập chỉ mục! Chương trình đã lập chỉ mục dữ liệu được cung cấp với dung lượng 20 gigabyte trong thời gian kỷ lục là 3 giờ 17 phút. Và kích thước của chỉ mục được tạo hóa ra là nhỏ nhất 4,4 GB - nhỏ hơn 100 megabyte so với Google Desktop Search.

Ngoài các tệp và thư mục thông thường, chương trình còn hỗ trợ lập chỉ mục email, kết nối và lập chỉ mục cơ sở dữ liệu (!) Và các nguồn bên ngoài khác (DMS, CRM), ngay lập tức trong quá trình lập chỉ mục, bạn có thể chỉ định từ điển để tiến hành tìm kiếm hình thái và tất cả các thuộc tính có thể được lập chỉ mục các tập tin. Sau khi tạo chỉ mục, khi cố gắng tiến hành tìm kiếm tài liệu thử nghiệm đầu tiên, bạn có thể hơi bối rối: “ở đây có hai loại tìm kiếm, nhưng tôi cần loại nào?” Như đã đề cập trước đó, điều chính là đọc trợ giúp, sau đó mọi thứ sẽ trở nên rõ ràng. Chương trình thực sự có thể thực hiện hai loại tìm kiếm - tìm kiếm cụm từ và tìm kiếm các tài liệu có nội dung tương tự với văn bản truy vấn.

Mô tả về tất cả các chức năng chính để phân tích truy vấn tìm kiếm đã được đưa ra ở trên, vì vậy bây giờ chúng tôi sẽ chỉ liệt kê các khả năng tìm kiếm do chương trình này cung cấp. Hãy bắt đầu với tìm kiếm cụm từ: tất nhiên, tìm kiếm hình thái, tìm kiếm trích dẫn, thao tác logic, tìm kiếm bằng phân tích từ (tìm kiếm ở đầu từ, ở cuối, ở phần giữa hoặc khớp hoàn chỉnh), tìm kiếm trích dẫn hỗn hợp ( khi tất cả các từ trong truy vấn phải có trong tài liệu, nhưng không nhất thiết phải theo thứ tự đã nhập), tìm kiếm có sửa lỗi, sử dụng từ đồng nghĩa, “tìm kiếm gần như trích dẫn” (tìm kiếm cụm từ đã nhập dưới dạng trích dẫn, nhưng các từ khác có thể hiện diện giữa các từ đã nhập), v.v. Một số tùy chọn được liệt kê có cài đặt cụ thể của riêng chúng. Ngoài ra, có thể sử dụng từ điển các từ không quan trọng và chương trình đã có sẵn danh sách các từ này, bạn cũng có thể sử dụng từ điển các từ ưu tiên để tìm kiếm (tất nhiên, bạn sẽ phải điền vào). bản thân bạn).

Về nguyên tắc, ở đây chúng tôi đã xem xét ngắn gọn tất cả các tính năng chính của tìm kiếm cụm từ.

Hãy chuyển sang xem xét các tính năng của chương trình này - tìm kiếm các tài liệu tương tự. Các nhà phát triển khẳng định rằng đây hoàn toàn không phải là một tìm kiếm văn bản đơn giản, nó chính xác là một “tìm kiếm những cái tương tự” - đây chính xác là cách nó được mô tả ở mọi nơi, nhưng ồ, bạn có thể gọi nó là bất cứ thứ gì bạn muốn - điểm chính là . Tìm kiếm nhanh trên Internet có thể nhanh chóng tiết lộ rằng cái gọi là "tìm kiếm tương tự" là một bước phát triển mới trong lĩnh vực phân tích văn bản. Hệ thống này cho phép bạn tìm các văn bản có nội dung ngữ nghĩa tương tự nhau. Điều thú vị nhất là sau khi tiến hành truy vấn tìm kiếm thử nghiệm, hóa ra lý thuyết khá trùng khớp với thực tế! Chương trình thực sự tìm kiếm các tài liệu có nội dung tương tự và hiển thị chúng trong danh sách, sắp xếp chúng theo tỷ lệ phần trăm giống nhau.

Tiếp theo, chúng ta hãy xem SearchInform (cụ thể là phiên bản công ty SearchInform Corporate) cung cấp những gì để làm việc trên mạng công ty. Có hai loại ứng dụng: phía máy chủ và phía người dùng. Phần máy chủ xử lý độc lập các chỉ mục được chỉ định và người dùng có thể sử dụng chúng để tìm kiếm, tùy thuộc vào quyền truy cập được gán cho chúng. Người dùng có thể được cấu hình tự động bằng tài khoản Windows (theo thuật ngữ chuyên nghiệp, SearchInform sử dụng xác thực Windows NTFS) hoặc thủ công (người dùng sẽ phải được thêm riêng). Mỗi người dùng có thể được phép hoặc từ chối quyền truy cập vào một số chỉ mục nhất định và người dùng cũng có thể được kết hợp thành các nhóm. Nhìn chung, các cài đặt để làm việc trên mạng của SearchInform đi trước Google về tính linh hoạt và Ishhound Server về sự tiện lợi và đơn giản.

Trang web chính thức:
Kích thước phân phối: 14,7 Mb So sánh tốc độ lập chỉ mục

Hệ thống tìm kiếmThời gian lập chỉ mụcKích thước chỉ mục
Bloodhound Prof Deluxe 4.538 giờ 46 phút19GB
Máy tính để bàn Isys 7.06 giờ 13 phút7,9GB
DtSearch 7.06 giờ 3 phút8,6GB
Doanh nghiệp Tìm kiếm Máy tính để bàn của Google8 giờ 17 phút4,5 GB
Tìm kiếm trên máy tính để bàn Copernic *10 giờ 51 phút7 GB
SearchInform 1.5.023 giờ 17 phút4,4GB

* Hầu hết các tài liệu.html và .txt chứa văn bản tiếng Nga, mặc dù chúng đã được lập chỉ mục, nhưng không thể tìm thấy ngoại trừ tên của chúng.

Tất cả các chương trình đều đáng được quan tâm.

Dựa trên các bài kiểm tra và kiểm tra cẩn thận từng chương trình được trình bày trong bài đánh giá, có thể rút ra một số kết luận nhất định. Vì vậy, Google Desktop Search Copernic Desktop Search khá phù hợp với người dùng thiếu kinh nghiệm làm hệ thống tìm kiếm thông tin tại nhà. Chúng xử lý tốt các truy vấn đơn giản, không làm người dùng quá tải với các cài đặt và hơn nữa là hoàn toàn miễn phí. Nỗ lực của Google nhằm thâm nhập thị trường công cụ tìm kiếm doanh nghiệp vẫn chưa chính đáng lắm: để nó hoạt động bình thường, chương trình cần được trang bị các mô-đun bổ sung và việc thiết lập không hề dễ dàng. Do đó, những cái tên dễ hiểu như Desktop Search, Copernic và Google dành cho chúng vị trí thích hợp là các công cụ tìm kiếm “máy tính để bàn”.

Các giải pháp thực sự, mạnh mẽ hơn - dtSearch, iSYS và SearchInform cũng không thể đánh lừa được và cung cấp cho người dùng các phiên bản “máy tính để bàn” của họ. Nhưng với mức giá hợp lý, không giống như phần mềm miễn phí của Google và Copernic. Tất nhiên, bạn phải trả tiền cho sức mạnh, tốc độ và chức năng. Nhưng tất nhiên, trọng tâm chính của các nhà phát triển dtSearch, iSYS và SearchInform là vào khu vực doanh nghiệp. Mạng, chức năng, lập chỉ mục và tốc độ tìm kiếm là những gì phân biệt các sản phẩm này với “đối thủ cạnh tranh” của chúng. Dựa trên kết quả kiểm tra, mục yêu thích đã được xác định - SearchInform. Chương trình cung cấp khả năng tìm kiếm các tài liệu tương tự, có tốc độ tìm kiếm và lập chỉ mục nhanh nhất cũng như có một bộ chức năng tốt.