Chỉ số đồng nghiệp Chủ đề PHP được cung cấp bởi SMF. Bài học thứ ba
Hãy bắt đầu ngay lập tức từ mã tập lệnh chính:
#! / usr / bin / perl
# Chữ cái nào-forum.pl.
# (C) 2010 Alexandr A Alexeev, http: // Trang /
sử dụng nghiêm ngặt;
# Dòng nhận xét - cho sự nghiêm ngặt
# Nếu nhiệm vụ là thu thập số liệu thống kê của động cơ, hãy để lại vì nó là
# Nếu bạn thực hiện một danh sách các diễn đàn - Rassate
dữ liệu $ của tôi;
$ Dữ liệu. \u003d $ _ Trong khi (<>
)
;
# Kiểm tra xem nó được cung cấp bao nhiêu bởi phpBB mà không cần tham khảo trong tầng hầm Điều này và các kịch bản khác được đề cập trong bài viết có thể được tìm thấy trong kho lưu trữ này. Kịch bản mà-forum.pl. Xem xét mã trang HTML cho sự hiện diện của chữ ký của động cơ diễn đàn trong đó. Chúng tôi đã sử dụng tiếp tân tương tự khi xác định WordPress và Joomla, nhưng có một vài sự khác biệt. Đầu tiên, chính kịch bản tự nó không tải lên mã trang và đọc nó từ STDIN hoặc một tệp được truyền dưới dạng đối số. Điều này cho phép bạn tải lên một trang một lần, ví dụ, sử dụng wget, sau đó lái nó qua một số máy phân tích nếu chúng ta không đơn độc. Thứ hai, trong kịch bản này, sự hiện diện của chữ ký là một dấu hiệu 100% của động cơ. Lần cuối, sự hiện diện của chữ ký chỉ đưa trọng lượng cho động cơ tương ứng và "thắng" động cơ với trọng lượng lớn nhất. Tôi quyết định rằng trong trường hợp này, phương pháp này chỉ sẽ làm phức tạp mã. Để kiểm tra công việc của kịch bản, tôi đã dành một nghiên cứu nhẹ. Tôi là một danh sách hàng ngàn diễn đàn và đã đẩy mỗi người trong số họ thông qua kịch bản của tôi, từ đó xác định tỷ lệ phần trăm triggings của chương trình và sự phổ biến của các động cơ khác nhau. Để có được một danh sách các diễn đàn, tôi đã tận dụng Google Parser. Công cụ tìm kiếm đã gửi các loại loại trang web: Diễn đàn. *. RU vân vân. Mã phát mã đầy đủ Bạn sẽ tìm thấy trong tệp gen-forumsearch-urls.pl.. Ngoài Vùng.RU cũng được sử dụng.Su .ua .kz i.by. Lần trước, nghiên cứu này rất khó khăn, vì các trang web trên WordPress và Joomla không có chữ ký tương tự trong URL. Các danh mục như cmsmagazine.ru/catalogue/ không cung cấp lấy mẫu đủ. 600 trang web trên Drupal là gì? Tôi phải thừa nhận, kết quả của thí nghiệm đã rất buồn về tôi. Trong số 12590 trang web đã nghiên cứu, chỉ có 7083 động cơ được xác định thành công, nghĩa là, chỉ trong 56% trường hợp. Có lẽ tôi đã không tính đến bất kỳ động cơ nào? Nó thực sự là bitrix một nửa để xem? Hay tôi có nhiều thời gian hơn để trả tiền tìm kiếm chữ ký? Nói chung, nghiên cứu bổ sung là cần thiết ở đây. Trong số 56% động cơ được xác định thành công phổ biến nhất, như mong đợi, hóa ra là IPB (31%), phpBB (26,6%) và Diễn đàn (26,5%) Đối với họ với độ trễ lớn phía sau SMF (5,8%) và DleForum (5,3%). Punbb yêu thích của tôi chỉ là vị trí thứ 6 (1,64%). Tôi sẽ không khuyên nên tin tưởng đáng tin cậy những con số này (họ nói, mỗi diễn đàn thứ ba trong Runet hoạt động trên IPB), nhưng tất nhiên, kết luận nhất định làm, bạn có thể. Ví dụ: nếu bạn có ý định tạo một trang web trên công cụ diễn đàn và kế hoạch sửa đổi diễn đàn, hãy thanh toán cho người dùng 0,01 đô la cho mỗi tin nhắn với đầu ra tự động của các quỹ mỗi tuần một lần, sau đó bạn nên chọn một trong ba người phổ biến nhất động cơ. Diễn đàn càng phổ biến, cơ hội tìm kiếm một lập trình viên càng lộng lẫy trong đó càng nhiều. Nếu những thay đổi đáng kể trong động cơ không được mong đợi, nó có thể có ý nghĩa để chọn không phải là động cơ phổ biến nhất, ví dụ SMF hoặc PunBB. Bằng cách này, bạn sẽ giảm số lượng tấn công hacker trên diễn đàn của mình và số lượng thư rác tự động gửi trên đó. Các tập lệnh để tìm kiếm / định nghĩa của các diễn đàn cũng có thể được tìm thấy không một ứng dụng thực tế. Điều đầu tiên xuất hiện trong đầu tôi là sắp xếp các diễn đàn được xác định trên Titz và đặt các bài đăng có liên kết đến một trong hàng trăm trang đầu tiên. Tuy nhiên, hàng trăm liên kết dofolllow diễn đàn không ảnh hưởng đến TIC (2 bản cập nhật được thông qua), vì vậy tốt hơn là không dành thời gian ở đây, trừ khi bạn quan tâm đến việc chuyển tiếp. Rõ ràng là tên của các kịch bản cách xa người duy nhất. Tôi nghĩ rằng bạn sẽ dễ dàng đưa ra cách khác bạn có thể sử dụng chúng. Được tổ chức bởi Botmaster Labs, không có kế hoạch. Thời gian là không, video là cần thiết cho cuộc thi, như một xu hướng thời trang mới, mặc dù nó dễ dàng hơn cho tất cả các ảnh chụp màn hình tốt (IMHO của tôi) có thể được giải thích (IMHO của tôi), và không có gì muốn rơi. Những người rất ít còn lại của lợi nhuận, spam ngu ngốc hoàn toàn không phải là thuế, ở đây cần phải suy nghĩ và các chủ đề sẽ không rơi ra, nếu chỉ những người học cách cố gắng cố gắng xô vào một chiếc len đẹp và bơi a ít. :) Nhưng đây không phải là về chúng tôi. Nói chung, 3 "không" này, tôi nghĩ, chủ yếu trở thành rào cản tham gia vào cuộc thi cho hầu hết những người tham gia tiềm năng. Ở đây như với việc sửa chữa một chiếc xe gồm ba: giá rẻ, chất lượng cao, nhanh chóng - chỉ có 2 điều kiện có thể được thực hiện đồng thời. Ngồi và chọn mà bạn gần hơn. :) Với cuộc thi, điều tương tự là: Có thời gian, tôi biết cách tạo video, nhưng không có chủ đề nào, hoặc tôi biết cách tạo video, có một chủ đề, nhưng không có thời gian, hoặc Và thời gian miễn phí đã xuất hiện và có một cái nhỏ, nhưng có một thời gian nhỏ hơn. Nhưng điều này là tốt nếu đồng thời 2 điều kiện được thực hiện. Chà, oh tốt, ném lời bài hát. Tôi tiếp tục với chính mình. Tôi không có kế hoạch, điều đó có nghĩa là tôi tham gia vào cuộc thi, thậm chí đã chọn bài viết nào để bỏ phiếu. Những gì không nói, và liều rất rõ và rất hợp lý để áp dụng nó. Nhưng hôm nay tôi đã học được rằng những mưu đồ xuất hiện trong cuộc thi. Hóa ra tôi không thể bỏ phiếu, nhưng chỉ có thể khiến những người mới đến có được phần mềm vào năm 2011 và cuộc thi được thiết kế cho họ. Ngạc nhiên nhỏ, nhưng chủ sở hữu - Barin. Cạnh tranh là một công ty quảng cáo và Alexander biết cách tiến hành nó. Nói chung, tôi đã quyết định sau đó để đưa ra một bài viết, nó dễ viết hơn một chút, khi rõ ràng với ai, đối với toàn bộ trang trại tập thể, nó thực sự không thể làm điều này. Được cung cấp bởi php-Fusion Trong Khrumber Phiên bản 7.07, chương trình được đào tạo về một số động cơ mới: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, v.v. phpbb-fr.com, chủ đề Solaris phpbb Và quá trình học tập liên tục là mới. "Được cung cấp bởi SMF 1.1.2" Được cung cấp bởi SMF 1.1.3 Được cung cấp bởi SMF 1.1 RC2 Được cung cấp bởi SMF 1.1.4 Được cung cấp bởi SMF 1.1.8 Được cung cấp bởi SMF 1.1.7 "2006-2008, máy đơn giản LLC" Và đó không phải là tất cả. Thu thập các phiên bản của động cơ Chúng tôi đang ở một số diễn đàn của CMF trong chân trang, chúng tôi khám phá ra "2001-2006, Lewis Media". Kiểm tra yêu cầu này, nó cũng hoàn toàn thỏa mãn chúng tôi. Tìm một yêu cầu tương tự: "2001-2005, Lewis Media." Chạy chân trang bên cạnh để tìm truy vấn sau: "Thiết kế SMFone của A.M.A, được chuyển đến SMF 1.1". Kiểm tra - xuất sắc. Vân vân. Nửa giờ làm việc và bạn có một cơ sở dữ liệu tuyệt vời về các yêu cầu trên động cơ và đối với các yêu cầu này, Google sẽ bị cấm ít hơn nhiều so với việc bạn sử dụng các nhà khai thác trong đó. Đồng thời, cơ sở sẽ sạch hơn đáng kể so với nếu bạn sử dụng các yêu cầu, chẳng hạn như "index.php? Chủ đề \u003d", bởi vì ở đây, Google sẽ không chỉ cung cấp cho các diễn đàn chúng ta cần, mà còn rất nhiều tài nguyên trái nơi quản lý Để lại một liên kết đến chủ đề Toum. Bạn có thể tranh luận, họ nói, có chuyện gì với điều đó? Những người khác rời khỏi liên kết, nó có nghĩa là chúng ta có thể. Nhưng! Liên kết có thể rời khỏi không chỉ một manter, mà còn các chương trình khác. Hơn nữa, chúng có thể được mài sắc đặc biệt để để lại bình luận theo một tài nguyên nhất định, phần mềm được gọi là hẹp, cộng với các liên kết như vậy có thể được để lại bằng tay. Một lần nữa tôi nhắc lại, chúng tôi không phải là số lượng của việc bán phá giá, nhưng chất lượng, các yêu cầu chính xác mà chúng tôi sẽ thu thập. Cộng với phương pháp này cũng trong thực tế là bạn sẽ không cần phải cấu hình trong HRERER rây -filter.
伟哥 - Viagra. - Guitar - Ngày lễ 保险 - bảo hiểm Đặt vào tệp từ ở đây các mã này đang thay thế chúng: % E4% BC%% 9F% E5% 93% A5 % E5% 90% 89% E4% BB% 96 % E5% 85% B6% E4% BB% 96 % E4% BF% 9D%% E9% 99% A9% E5% 85% AC% E5% 8F% B8 Nếu bạn đang quảng cáo trang web để bảo hiểm, thì hãy đặt một liên kết trong hồ sơ theo chủ đề (!) Ngay cả Diễn đàn Trung Quốc đã tìm thấy theo yêu cầu " diễn đàn SMF "保险 公司 Nó sẽ rất tốt.
in "phpbb. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? phpbb \\ .com \\ /? "[^\u003e] *\u003e phpbb / i Hoặc là.
# $ Data \u003d ~ /viewForum\\.php \\? [^ "" ** f \u003d \\ d + / i hoặc
$ DATA \u003d ~ / phpbb \\ -seo / i hoặc
$ DATA \u003d ~ /)
;
in "IPB. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (?: www \\.)? -?: Board | Power) \\. com \\ /? [^ "] *" [^\u003e] *\u003e [^.<]*IP\.Board/i
Hoặc là.
$ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / / (?: www \\.)? Invisionboard \\ .com \\ /? "[^\u003e] *\u003e Bảng điện Invision / i Hoặc là.
$ DATA \u003d ~ /
$ DATA \u003d ~ / Index /.php\\?[h""**shoforum\u003dd+/i.)
;
in "vBulletin. \\ n "
nẾU ($ DATA \u003d ~ / Được cung cấp bởi:? [^<]+vBulletin[^<]+(?:Version)?/i
Hoặc là.
$ DATA \u003d ~ /)
;
in "SMF. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / / (?: www \\.)? SimpleMachines \\ .org \\ /? "[^\u003e] *\u003e Được cung cấp bởi SMF / I Hoặc là.
$ DATA \u003d ~ /Index\\.php\\ ?[ ^""" exboards\u003d\\d+\\.0/i.)
;
in "punbb. \\ n "
nẾU ($ DATA \u003d ~ /] + Href \u003d "[^"] * Http: \\ / / / (? :( ?: www \\.)? Punbb \\ .org | punbb \\ .informer \\ .com) \\ /? "[^\u003e] *\u003e Punbb / I.); #Hoặc là.
# $ Data \u003d ~ /viewForum\\.php'?f[ ^"""""""""""""""""""""";
in "fluxbb. \\ n "
# if ($ data \u003d ~ /viewtopic\\.php\\?id\u003dd+/i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d "http: \\ / / (?: www \\.) fluxbb \\ .org \\ /?" [^\u003e] *\u003e fluxbb / i)
;
in "exbb. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (? www \\.)? exbb \\ .org \\ /? "[^\u003e] *\u003e exbb / i); # HOẶC LÀ
# $ Data \u003d ~ /forums\\.php'?""**_forum\u003dd+/i);
in "Yabb. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / \\ / / (?: www \\.)? yabbforum \\ .com \\ /? "[^\u003e] *\u003e yabb / i Hoặc là.
$ DATA \u003d ~ /yabb\\.pl ~ /) "" * _ num \u003d \\ d + / i);
in "dleforum. \\ n "
nẾU ($ DATA \u003d ~ / \\ (Được cung cấp bởi diễn đàn DLE \\)<\/title>/ TÔI. Hoặc là.
$ DATA \u003d ~ /] + href \u003d "[^"] + (?: http: \\ / \\ / (?: www \\.)? dle \\ -files \\ .ru | Actright \u003d Bản quyền) [^ "] *"\u003e Diễn đàn DLE<\/a>/ TÔI.)
;
in "ikonboard. \\ n "
nẾU ($ DATA \u003d ~ /] + href \u003d "[^"] * http: \\ / / / (? www \\.)? ikonboard \\ .com \\ /? [^ "] *" [^\u003e] *\u003e ikonboard / i Hoặc là.
$ DATA \u003d ~ /\\ n "
nẾU ($ DATA \u003d ~ /\\ n "
# if ($ data \u003d ~ /forums\\.php\\?fid\u003d\\d+/i hoặc
# $ DATA \u003d ~ / chủ đề \\ .php \\? fid \u003d \\ d + / i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d "http: \\ / / / (?: www \\.)? flashbb \\ .net \\ /?" [^\u003e] *\u003e flashbb / i)
;
in "Stokesit. \\ n "
# if ($ DATA \u003d ~ / forum\\.php\\?f\u003d\\\\d+/i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d "http: \\ / / / (?: www \\.)? StOkesit \\ .com \\ .au \\ /?" [^\u003e] *\u003e [^ \\ /] * Stokes It / i)
;
in "Podium. \\ n "
# if ($ data \u003d ~ / chủ đề ~ fp \\? t \u003d \\ d + / i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d [""]? http: \\ / / / (? www \\.)? SopeBox \\ .com \\ /? [""]? [^\u003e] *\u003e Podium / i)
;
in "SỬ DỤNGBB. \\ n "
# if ($ data \u003d ~ /forum\\.php\\?id\u003d\\d+/i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d "http: \\ / \\ / / (?: www \\.)? USBB \\ .net \\ /?" [^\u003e] *\u003e usebb / i)
;
in "wrforum. \\ n "
# if ($ data \u003d ~ / index ~ fp \\? fid \u003d \\ d + / i hoặc
nẾU ($ DATA \u003d ~ /] + href \u003d "http: \\ / \\ / / (?: www \\.)? wr \\ -script \\ .ru \\ /?" [^\u003e] *\u003e wr \\ -forum / i)
;
in "YeterAnodyForumNet. \\ n "
if ($ DATA \u003d ~ / et một diễn đàn khác \\ .net / i hoặc
$ DATA \u003d ~ /Default\\.aspx\\?g\u003dposts&t\u003d\\d+/i.)
;
Trang web: Nói chuyện. *. RU
Trang web: Bảng. *. RU
Trang web: SMF. *. RU
Trang web: phpbb. *. Ru
....
Gia nhập lâu kết thúc, bây giờ đến điểm.
Điều gì là cần thiết bởi một người mới khi anh ta có được một kết hợp siêu như vậy là phức hợp xrumer + hrefer? Đúng vậy, học cách làm việc trên nó và loại bỏ các ảo tưởng mà, bắt đầu spam các tờ, bạn có thể kiếm tiền. Nếu bạn nghĩ vậy, tốt hơn là hy sinh ngay tiền của bạn cho từ thiện. Bạn cần học cách sử dụng các công cụ của phức tạp, tốt nhất là rút lại nó dưới chính bạn. Thời gian "mất nhiều hơn - ném thêm" đã biến mất. Con số kém hơn chất lượng. Vì vậy, chúng tôi sẽ thu thập cơ sở dữ liệu cho chính mình, không học cách làm điều đó - giữ lại từ tàu. Điều này sẽ giúp chúng ta, tự nhiên, hrefer. Nếu bạn có kế hoạch quảng bá tài nguyên của mình trong Google, thì chúng ta cần tìm các trang web của nhà tài trợ thông qua Google. Tôi nghĩ rằng nó là dễ hiểu và logic. Nhưng Google, giống như một nữ tiếp viên của Núi đồng, không mang lại sự giàu có cho tất cả mọi người liên tiếp. Nó là cần thiết cho nó. Ngay lập tức tôi muốn nói rằng không hy vọng rằng trong căn cứ mà bạn tìm thấy trong một công chúng, bạn có thể thu thập một cái gì đó. Họ là vì chúng có sẵn ở một công chúng rằng bạn là thành viên của họ. Tôi sẽ không phát triển chủ đề hơn nữa. Tốt hơn là sẽ cho bạn biết cách thu thập đúng cách, để bạn thấy kết quả, phần còn lại của bản thân cải thiện, điều chính là hiểu nguyên tắc. Cần phải thu thập theo chính xác, về các dấu hiệu cụ thể, động cơ chúng ta cần và không có dấu hiệu của các diễn đàn. Đây là sai lầm chính của những người mới - không tập trung vào một người cụ thể và cố gắng hoàn toàn bao quát mọi thứ. Và ngay cả khi bạn muốn đăng ký thêm hoặc ít hơn cơ sở dữ liệu bình thường, từ chối sử dụng trong các yêu cầu của các nhà khai thác. Không có "Inurl:", "Trang web:", "Tiêu đề", v.v. Google như bạn tìm kiếm bị cấm ngay lập tức. Do đó, nghiên cứu kỹ các động cơ mà kích thước hiện đang hoạt động:
Nói chung, chúng ta cần chuẩn bị các yêu cầu phù hợp cho Paracement Khrefer. Lấy ví dụ: diễn đàn diot Diễn đàn SMF.. Và hãy bắt đầu tháo rời nó trên phụ tùng bưu kiện. Trong đó, chúng tôi sẽ giúp Google yêu thích của chúng tôi. Chúng tôi nhập vào yêu cầu của Google Diễn đàn SMF. - Nhiều rác đang dẫn độ, bọc trên một trang thứ 13 và chọn bất kỳ liên kết nào. Tôi đã xem qua điều này: http://www.volcanohost.com/forum/index.php?topic\u003d11.0. Mở nó và nghiên cứu nó. Chúng ta cần tìm một cái gì đó đặc trưng trên trang mà bạn có thể áp dụng cho tìm kiếm các trang khác trên động cơ này. Trong chân trang để nhận thấy dòng chữ sau đây Được cung cấp bởi SMF 1.1.14, Tôi dành nó và giới thiệu nó với Google, nó cho chúng ta thấy rằng trong yêu cầu này, ông biết về khoảng 59 triệu lựa chọn. Tôi xem ngắn gọn liên kết, thêm một vài tùy chọn khác vào từ khóa này, ví dụ: "Được cung cấp bởi Poplar SMF 1.1.14" hoặc là "Được cung cấp bởi SMF 1.1.14" Viagra. Chúng tôi tin rằng yêu cầu này là sang trọng, trong cuộc dẫn dắt chỉ các diễn đàn và hầu như không có rác.
Đối với chúng tôi, hơn nữa, không có số tiền thú vị, nhưng chất lượng như tôi đã nói ở trên. Đi trước. Từ cùng một diễn đàn, chúng tôi lấy một cụm từ khác của chân trang: Ngoài ra, nó được trích dẫn và sương mù Google. Đáp lại, anh ta cho thấy rằng anh ta biết hơn 13 triệu kết quả. Chúng tôi một lần nữa xem xét ngắn gọn về việc phát hành, thêm Dopper và kiểm tra việc phát hành chúng. Chúng tôi tin rằng yêu cầu là tuyệt vời và gần như không có rác. Nói chung, đã có 2 truy vấn sắt. Tôi đề nghị, diễn đàn đầu tiên vẫn còn phải để một mình và tiếp tục thu thập các yêu cầu trên các diễn đàn khác. Lợi ích của Google đang mở theo yêu cầu 2006-2008, máy đơn giản LLC. Chúng tôi lấy từ việc phát hành, ví dụ, các diễn đàn này: http://www.snowlinks.ru/forum/index.php?topic\u003d1062.0 và http://litputnik.ru/forum/index.php?action\u003dprintpage; Chủ đề \u003d 380.0 Trong đồ đứng, họ thực hiện các yêu cầu sau: "Được cung cấp bởi SMF 1.1.7" và "được cung cấp bởi SMF 1.1.10" (để truyền bá các yêu cầu cho sự đồng nhất luôn được tư vấn về khí luyện, bởi vì chúng ta cần chất lượng đầu tiên). Tôi nghĩ rằng rõ ràng những gì chúng tôi làm, cuối cùng chúng tôi sẽ có một cơ sở dữ liệu nhất định các yêu cầu tìm kiếm các diễn đàn trên công cụ SMF (ví dụ, nó được chọn, với các động cơ khác tương tự).
Nó sẽ trông giống thế này:
Tôi nghĩ rằng để học ở giai đoạn đầu để sử dụng thành thạo khu vực là rất quan trọng, bởi vì bạn luôn có thể tìm thấy việc sử dụng Chrumer, bất kể tình huống không thay đổi như thế nào. Bảo vệ rất phức tạp và nếu trên một số loại động cơ đã củng cố sự bảo vệ và nó không đối phó với nó tại thời điểm này, ở đây, nó không có ý nghĩa gì để tiêu tài nguyên để thu thập dữ liệu của các liên kết, và sau đó để làm việc trên chúng, nó là Tốt hơn để tập trung sức mạnh vào những gì mang lại kết quả. Và đồng thời, nếu nhóm Botmaster Labs đã dạy một Chainrovum cho một cái gì đó mới, bạn có thể nhanh chóng phân tán một bệnh nhân mới và chuẩn bị một căn cứ Chrumera cho đến khi bệnh nhân vẫn ấm áp. Thời gian là tiền, tài nguyên có thể không còn phù hợp khi bạn mua cơ sở dữ liệu. được thu thập bởi một ai đó. Ngoài ra, bộ sưu tập chính xác của các căn cứ dưới mức mở rộng đáng kể ứng dụng "trắng" của một chroymmer. Và đây chính xác là nơi mọi thứ đang di chuyển, chúng tôi muốn hoặc không, và quá trình độ trắng hoặc xám đang đến. Tấm đen cho những gì chỉ có thể đi vào quá khứ.
Tất cả những người khác, đã là những khoảnh khắc kỹ thuật làm việc với Khrefer có thể được xem trong GIÚP và nó không có ý nghĩa để ngăn chặn chúng, tất cả các điểm mục tiêu được tiếp xúc với một cách có kinh nghiệm cho mỗi máy.
Là một phần thưởng, hãy đặt một mẫu cho phân tích cú pháp của công cụ tìm kiếm Trung Quốc Baidu, một ngày khác tôi được hỏi về anh ta, tôi đã làm giữa doanh nghiệp, xin lỗi vì đã chơi chữ. :)
Tên máy chủ \u003d http: //www.baidu.com
Query \u003d s? Wd \u003d
Linksmask \u003d.
TotalPages \u003d 100.
NextPage \u003d.
NextPage2 \u003d.
Captchaurl \u003d.
Captchaimage \u003d.
Captchafield \u003d.
Tôi đã cố gắng đổ bài kiểm tra cho họ, lệnh cấm không, các tài nguyên của hrefer được thu thập một cách sống động, tất cả các yêu cầu phân tích cú pháp tương tự như Googlovsky, mà là tài nguyên của người Trung Quốc - biển và với một PR cao, và ngoài ra, một rất nhiều nơi không cần một chân châu âu. Poule tốt hơn yêu cầu Trung Quốc. Google-Translete sẽ giúp điều này, bạn quay số danh sách các ký tự chính bằng tiếng Nga và dịch nó sang tiếng Trung. Đúng trong " từ ngữ."Hướng dẫn từ không thể được gấp lại trên tiếng Trung, bạn cần phải mã hóa lại.
Thay vì tiếng Trung:
Tóm lại, tôi muốn nói rằng tôi không bao giờ hiểu những người phàn nàn rằng Khrefer là xấu hoặc tôi luôn muốn nói, bạn chỉ không biết nấu chúng. Khrevel tốt hơn không có trình phân tích cú pháp có thể thu thập phát hành, chỉ cần yêu cầu phải chính xác. Hrefer - máy: tốt, chất lượng tốt, được tạo ra bằng tiếng Đức, nhưng quản lý người đàn ông của cô ấy và tất cả phụ thuộc vào mức độ nhạy cảm của nó, bạn không thể đồng thời làm cho chiếc xe và phải và trái.
Một chủ đề riêng biệt đang làm sạch các căn cứ, tôi đã 3 năm trước cho cuộc thi trước đó. Với cái càng lớn, mọi thứ vẫn có liên quan, nhưng từ việc kiểm tra 200 OK bây giờ bạn có thể từ chối, tôi thực sự không thực sự thích quá trình này, rất sai sót, lọc thêm nhiều. Bây giờ nó có thể được thực hiện thực tế trên máy trong công việc của Chrumer, ít nhất quá trình này không phải là một sự tương tự hoàn chỉnh của kiểm tra trên "200 OK". Nhìn chung, kinh doanh: Cách đây không lâu, một cơ hội tuyệt vời đã xuất hiện trong Chrumera - để lấy thông tin từ các tài nguyên tại thời điểm thực hiện dự án. Có vẻ như thế này. Bạn lái xe trong mẫu sẽ được xử lý trong quá trình làm việc và thông tin được thu thập bởi mẫu sẽ được nhập vào tệp xgrambed.txt trong thư mục nhật ký. Bạn có thể sử dụng chức năng này cho bất cứ điều gì, chuyến bay của Fantasy là rất lớn. Tôi sử dụng tính năng này một lần một tuần để xóa tài liệu tham khảo khỏi cơ sở làm việc. Không có gì bí mật rằng các diễn đàn sẽ chết đi mỗi ngày để dọn dẹp căn cứ khỏi các tài nguyên đó cho chúng tôi và sẽ giúp trong trường hợp này là công cụ tự động hóa.
Bạn sẽ đồng ý, thường đạt được, ví dụ, http://www.laptopace.com/index.php, chúng ta đã thấy rằng tên miền đã có, ví dụ, goudyada chạy, nhưng không có diễn đàn ở đó. Vì vậy, để ném ra xỉ này từ căn cứ, chúng ta sẽ lấy. :) Mở mã nguồn của trang và chúng ta thấy mục này ở đó:
Bây giờ tất cả những người chết chết từ Goudaddy sẽ được chúng tôi biết theo thứ tự.
Dưới đây là một lựa chọn nhỏ cho công cụ AutoGrabbing, nếu bạn muốn dọn dẹp cơ sở dữ liệu từ các tên miền "phơi sáng" khác nhau: