Bộ sưu tập các từ thu thập chìa khóa. Từ an toàn cho Key Collector - cơ sở dữ liệu đầy đủ nhất! Thu thập thông tin về đối thủ cạnh tranh

Xin chào tất cả mọi người!

Sau khi tạo tài khoản, bạn có thể tiến hành theo hướng dẫn bên dưới:

Tuyệt vời! Key Collector đã được cấu hình thành công, nghĩa là bạn có thể tiến hành trực tiếp việc biên dịch lõi ngữ nghĩa.

Biên dịch lõi ngữ nghĩa trong Key Collector

Trước khi bắt đầu thu thập các cụm từ khóa cho Yandex.Direct, tôi khuyên bạn nên đọc, trong đó bạn sẽ tìm thấy rất nhiều thông tin hữu ích về các cụm từ khóa (chỉ dành cho người mới bắt đầu). Bạn đọc nó xong chưa? Hãy xem một ví dụ khác về việc thu thập lõi ngữ nghĩa để sửa chữa các thiết bị gia dụng:

Khi đó, bạn sẽ không khó để thu thập mặt nạ các cụm từ khóa rất cần thiết để phân tích cú pháp thông qua Key Collector.

  1. Đảm bảo chỉ ra khu vực nơi từ khóa được thu thập:
  2. Nhấp vào nút “Bộ sưu tập từ hàng loạt từ cột bên trái của Yandex.Wordstat”:
  3. Nhập mặt nạ cụm từ khóa và phân phát chúng thành các nhóm: Đây là kết quả. Nhấp vào “Bắt đầu thu thập”: Điều này được thực hiện để thuận tiện cho việc xử lý các cụm từ khóa. Bằng cách này, các yêu cầu sẽ không bị gộp vào một nhóm và bạn sẽ xử lý chúng dễ dàng hơn nhiều;
  4. Đợi cho đến khi việc thu thập các cụm từ khóa hoàn tất. Sau khi quá trình hoàn tất, bạn có thể thu thập tần suất truy vấn chính xác cũng như tìm hiểu chi phí ước tính cho mỗi lần nhấp vào quảng cáo, số lần hiển thị quảng cáo ước tính, ngân sách ước tính và số lượng đối thủ cạnh tranh cho một truy vấn cụ thể. Tất cả điều này có thể được tìm ra bằng cách sử dụng một nút duy nhất “Thu thập số liệu thống kê Yandex.Direct” (chúng tôi đã thêm nó vào bảng truy cập nhanh):
    Chọn tất cả các hộp theo ảnh chụp màn hình ở trên và nhấp vào “Nhận dữ liệu”;
  5. Đợi quá trình hoàn tất và xem kết quả. Để thuận tiện, hãy nhấp vào nút tự động điều chỉnh cột, nút này chỉ hiển thị những cột chứa dữ liệu:
    Chúng tôi cần dữ liệu thống kê mà chúng tôi hiện đã thu thập để phân tích tình hình cạnh tranh cho từng cụm từ khóa và ước tính chi phí quảng cáo gần đúng cho chúng;
  6. Tiếp theo, chúng ta sẽ sử dụng một công cụ Key Collector thú vị và tiện lợi như “Phân tích nhóm”. Chúng tôi đã thêm nó vào Thanh công cụ truy cập nhanh, vì vậy chỉ cần truy cập nó từ đó:
    Key Collector sẽ nhóm tất cả các cụm từ khóa theo từ và sẽ thuận tiện cho chúng ta xử lý từng nhóm yêu cầu. Nhiệm vụ của bạn: xem qua toàn bộ danh sách các nhóm; tìm các nhóm truy vấn chứa các từ không phải mục tiêu, nghĩa là các từ phủ định và thêm chúng vào danh sách thích hợp; Đánh dấu các nhóm yêu cầu này để xóa sau. Bạn có thể thêm một từ vào danh sách bằng cách nhấp vào nút nhỏ màu xanh: Sau đó, một cửa sổ nhỏ sẽ xuất hiện nơi bạn cần chọn danh sách các từ phủ định (danh sách 1(-)) và nhấp vào nút “Thêm để dừng từ”: Bằng cách này bạn làm việc thông qua toàn bộ danh sách. Đừng quên đánh dấu các nhóm bằng các từ không phải mục tiêu. Cụm từ khóa được tự động đánh dấu trong bảng truy vấn tìm kiếm;
  7. Sau đó, bạn cần xóa các cụm từ không phải mục tiêu được đánh dấu trong bảng truy vấn tìm kiếm. Việc này được thực hiện bằng cách nhấp vào nút “Xóa cụm từ”:
  8. Chúng tôi tiếp tục xử lý các cụm từ. Như bạn nhớ, trong Yandex Direct vào đầu năm 2017 đã xuất hiện trạng thái “Ít lần hiển thị” (chúng tôi đã xử lý nó) và để tránh trạng thái này, cần phân bổ các yêu cầu có tần suất thấp (yêu cầu tần số thấp) vào một nhóm riêng biệt. Đầu tiên, áp dụng bộ lọc cho cột “Tần số cơ sở”:
    Tham số bộ lọc: Tần số cơ bản, nhỏ hơn hoặc bằng 10. Tôi đặt các tham số bộ lọc này dựa trên vùng hiển thị - Izhevsk:
    Sau đó, chúng tôi đánh dấu tất cả các cụm từ đã lọc:
  9. Chúng tôi tạo một nhóm con trong nhóm nơi công việc hiện đang diễn ra bằng tổ hợp phím đơn giản CTRL+Shift+T: Sau đó, chúng tôi chuyển các cụm từ đã lọc từ nhóm “Mua iPhone 6” sang nhóm “Ít hiển thị”. Chúng tôi thực hiện việc này bằng cách chuyển các cụm từ sang nhóm khác:
    Sau đó chỉ định các tham số truyền như trong ảnh chụp màn hình bên dưới (Được đánh dấu chuyển giao):
    Xóa bộ lọc khỏi cột “Tần số cơ sở”:

Bạn xử lý các nhóm còn lại theo cách tương tự. Tất nhiên, phương pháp này thoạt nhìn có vẻ tẻ nhạt, nhưng với một số kỹ năng, bạn có thể nhanh chóng, nhanh chóng tạo cốt lõi ngữ nghĩa cho Yandex Direct và đã tạo các chiến dịch trong Excel, sau đó tải chúng lên. Tôi mất khoảng 2 giờ để xử lý phần cốt lõi ngữ nghĩa theo cách này, nhưng điều này chỉ phụ thuộc vào khối lượng công việc.

Đây là một video khác nhưng đây là ví dụ về thu thập từ khóa phủ định:

Xuất cụm từ khóa sang Excel

Tất cả những gì chúng ta phải làm là xuất các cụm từ khóa sang một tệp để làm việc với Excel. Key Collector cung cấp hai định dạng tệp xuất: csv và xlsx. Tùy chọn thứ hai thích hợp hơn nhiều, vì cá nhân tôi làm việc trong đó thuận tiện hơn và quen thuộc hơn nhiều. Bạn có thể chỉ định định dạng tệp trong cùng cài đặt chương trình, trong tab “Xuất”:

Bạn có thể xuất cụm từ khóa bằng cách nhấp vào biểu tượng màu xanh lục trong bảng truy cập nhanh:

Mỗi nhóm được xuất riêng, nghĩa là một nhóm riêng là một tệp xlsx riêng. Tất nhiên, bạn có thể đặt tất cả các nhóm yêu cầu vào một tệp bằng công cụ “Nhiều nhóm”, nhưng khi đó sẽ vô cùng bất tiện khi làm việc với các tệp này, đặc biệt nếu có nhiều nhóm.

Tiếp theo, bạn cần xuất các từ khóa phủ định của mình. Để thực hiện việc này, bạn cần vào “Stop Words” và sao chép các từ phủ định vào bảng nhớ tạm để sau đó dán vào Excel:

Đây là cách tôi làm việc với Key Collector mà tôi cũng đã dạy bạn. Tôi chân thành mong muốn rằng bài học này sẽ giúp bạn thành thạo công cụ tuyệt vời này và ngữ nghĩa cốt lõi của bạn sẽ mang lại lưu lượng truy cập được nhắm mục tiêu riêng và rất nhiều doanh số bán hàng.

Hẹn gặp lại các bạn sớm!

Cách thu thập từ khóa phủ định cho Yandex Direct, cũng như ngữ nghĩa thuần túy và bán chạy nhất cho chiến dịch quảng cáo của bạn.

Có 2 cách tiếp cận để thu thập từ khóa và cụm từ phủ định:

Phương thức thể hiện

Nhiều đạo diễn đưa ra phương pháp tuyển chọn trong 20 phút, 10 phút hoặc thậm chí ít hơn.

Vấn đề là bạn thu thập kết quả từ Wordstat, chuyển chúng sang Excel hoặc một dạng tương tự và rút ra các khóa cũng như các từ bổ sung có liên quan từ đó, cuối cùng bạn chỉ còn lại một danh sách các điểm trừ.

Tại sao phương pháp này lại tệ và tại sao tôi sẽ dạy bạn phương pháp khác:

- Hạn chế.

Wordstat cho phép thu thập các truy vấn chỉ từ 40 trang đầu tiên. Ngay cả khi bạn không thu thập từng yêu cầu theo cách thủ công, nhưng với sự trợ giúp của một số plugin, bạn sẽ ngồi như một kẻ ngốc và lật qua bốn mươi trang.

- Không có khả năng thu thập danh sách đầy đủ các từ dừng.

Do những hạn chế của Wordstat, bạn sẽ có được một danh sách hợp lý nhưng không phải là một danh sách hoàn chỉnh. Điều này đặc biệt đúng đối với ngữ nghĩa rộng như căn hộ ở Moscow. Ở đó, các yêu cầu cho trang cuối cùng xảy ra với tần suất 300 yêu cầu. Và bạn cần phải rời đi ở mức 30 hoặc ít hơn, vì nếu bạn xuất hiện với những yêu cầu không phải mục tiêu, kể cả những yêu cầu cấp thấp, bạn sẽ mất rất nhiều tiền và nước mắt tương tự, đó là một niche đắt đỏ.

Ngoài ra, trong nhiều ngóc ngách, kết quả tìm kiếm trên thiết bị di động rất quan trọng và Yandex luôn gặp khó khăn với địa lý trên điện thoại - nó luôn mang lại cho tôi Nizhny Novgorod thay vì Saratov. Để kết quả phù hợp về mặt địa lý, bạn sẽ phải bật nhắm mục tiêu theo địa lý nâng cao, nhưng đồng thời trừ tất cả các thành phố mà bạn không muốn xuất hiện.

Phương thức express sẽ không mang lại cho bạn cơ hội này; bạn phải tự thêm nó vào.

— VÀ ĐIỀU QUAN TRỌNG NHẤT: sử dụng phương pháp của tôi, ngoài danh sách các điểm trừ, bạn sẽ thu thập được TẤT CẢ các từ khóa mục tiêu!

Thu thập từ khóa phủ định trongNhà sưu tập Kay

Việc phân tích cả ngữ nghĩa và từ “xấu” cho nó trong các dịch vụ đặc biệt sẽ dễ dàng và thuận tiện hơn nhiều. Bạn có thể sử dụng trình phân tích cú pháp Slovoeb, Magadan miễn phí (có phiên bản miễn phí), v.v., có khá nhiều chương trình.

Tôi sẽ cho bạn biết cách lọc các từ dừng trong Key Collector và đồng thời có được ngữ nghĩa chuyển đổi rõ ràng cho quảng cáo.

Tất cả bắt đầu với việc bạn thu thập các mặt nạ chính (hướng dẫn phân tích cú pháp) từ Wordstat hoặc ước tính ngân sách chiến dịch quảng cáo, sau đó nhân chúng lên và mang đến Kay Collector.

Ví dụ, nhiệm vụ là làm sáng tỏ ngữ nghĩa của việc bán tấm bạt lò xo ở Moscow. Chúng tôi đã thu thập tất cả các yêu cầu, chúng tôi thấy hình ảnh:

1. Vào cửa sổ từ an toàn.

2. Trong đó chọn kiểu tìm kiếm xuất hiện: ĐỘC LẬP với dạng từ của từ dừng. Bằng cách này, chúng tôi sẽ lấy tất cả các biến thể của một từ (thuê, thuê, cho thuê).

3. Nhấp vào dấu cộng màu xanh lá cây.

4. Trong cửa sổ thả xuống, hãy viết những từ có hại (cách nhau bằng dấu phẩy hoặc trên một dòng mới).

Tôi nên viết những từ tiêu cực nào ở đây?

Để bắt đầu, những điều rõ ràng nhất là những điều thể hiện ý định không mua, nhưng, chẳng hạn, để xem các đánh giá hoặc tự mình đối phó: làm thế nào, cái gì, tốt hơn, miễn phí, tự làm, cái gì, sửa chữa, ảnh, video. Nếu bạn đang bán một sản phẩm mới và không sử dụng bảng thông báo, hãy thêm “avito”. Vân vân.

Ở đây bạn cần đi sâu vào niche, hiểu rõ đặc điểm của quy trình bán hàng và suy nghĩ của khách hàng khi tìm kiếm. Điều gì là quan trọng khi lựa chọn, đặc điểm nào, điều khoản mua hàng, giao hàng, bảo hành hoặc dịch vụ.

5. Nhấp vào nút “Đánh dấu các cụm từ trong bảng”.

6. 15-20 từ rõ ràng nhất đã mang lại cho tôi 396 lượt tìm kiếm rác. Chúng tôi đưa chúng vào giỏ.

Chọn “Di chuyển cụm từ sang nhóm khác”, trong cửa sổ thả xuống, nhấp vào “Thùng rác” rồi “Ok”. Chúng tôi ngưỡng mộ kết quả (khoanh tròn màu xanh lá cây):

NHƯNG! Chúng tôi vẫn chưa hoàn thành những yêu cầu này. Chúng tôi đi đến giỏ hàng và xem xét các yêu cầu về tính khả dụng thương mại. Chúng ta thấy chìa khóa này “ảnh mua tấm bạt lò xo”:

Chúng tôi nhấn Ctrl+nhấp vào nó, chương trình sẽ chuyển chúng tôi đến Yandex với kết quả cho yêu cầu này. Chúng tôi cuộn qua, theo các liên kết và thấy rằng khóa đó là thương mại:

Hãy kéo nó trở lại.

7. Phía trên danh sách trong trường “bộ lọc nhanh”, viết từ “giá” và phân tích:

Tương tự, lọc theo các từ bán hàng khác (mua, đặt hàng, thành phố, giá cả) và lấy lại các key cần thiết. Trong niche này, mọi người đang tìm kiếm những tấm bạt lò xo không có lưới và cuối cùng họ cũng vào giỏ, tôi sẽ đưa họ đến nhóm làm việc.

8. Bước tiếp theo là loại bỏ các phím không đầy đủ.

Đây là những truy vấn có số lượng khá về tần số cơ bản, số 0 và số 1 về tần suất được trích dẫn (khi cụm từ bao gồm dạng từ nhưng không bao gồm các từ khác).

Nói cách khác, không ai tìm kiếm chúng ở dạng này và chúng có thể xuất hiện trong các truy vấn có ngữ nghĩa rộng hơn hoặc đơn giản là mang tính thông tin. Mọi người không viết: "tấm bạt lò xo có lưới cm" - có lẽ họ muốn nói đến một tấm bạt lò xo có đường kính nhất định. Và đây là chìa khóa thông tin.

Thủ tục: Nhấp vào trường “Tần số” và từ đó sắp xếp tần số với dấu ngoặc kép theo thứ tự giảm dần. Di chuyển đến tần số 0 và xem. Chúng tôi thấy như sau:

Chúng tôi xóa mọi thứ như thế này, nếu không chúng tôi sẽ không còn tiền.

9. Dọn dẹp thành phố.

Serge Arsentiev

KeyCollector: biên soạn chuyên nghiệp lõi ngữ nghĩa.

Cốt lõi ngữ nghĩa là cơ sở để thúc đẩy thành công bất kỳ dự án Internet nào. Vì vậy, điều quan trọng là phải chú ý tối đa đến giai đoạn này. Để thực hiện việc này, bạn có thể sử dụng chương trình phổ biến nhất để thu thập các truy vấn tìm kiếm chính - KeyCollector.

KeyCollector là một chương trình trả phí, nhưng đáng giá từng đô la chi cho nó.

Đây là trình phân tích cú pháp thực sự xuất sắc và mạnh mẽ cho nhiều chỉ báo khác nhau, từ từ khóa, giá thầu trong Yandex.Direct và Google.Adwords, kiểm tra sự phụ thuộc địa lý và tính chính xác của dạng từ, mức độ cạnh tranh và kết thúc bằng phân tích dữ liệu nâng cao từ công cụ tổng hợp SEO hàng đầu.

Đơn giản là không thể mô tả tất cả các khả năng của chương trình trong một bài viết, vì vậy bây giờ tôi sẽ tập trung vào điều quan trọng nhất trong số đó - việc biên soạn lõi ngữ nghĩa một cách chuyên nghiệp.

Có thể có khá nhiều phương pháp để chọn, lọc và nhóm các yêu cầu, nhưng tôi sẽ mô tả quá trình chọn khóa bằng Key Collector chính xác như tôi “đã quen” thực hiện với thời gian tối thiểu và đạt được kết quả mong muốn. Tôi thường mất khoảng 10-15 phút để chọn chìa khóa cho một chủ đề được quảng cáo. Vậy hãy bắt đầu.

Ngay sau khi mở, Key Collector sẽ đề nghị tạo một dự án mới hoặc mở một dự án cũ. Trong một dự án, nên chọn và lưu trữ các truy vấn chính cho toàn bộ trang web nếu nó tương đối nhỏ, chẳng hạn như tối đa 1000 trang. Vì vậy, tên dự án của tôi thường là tên của trang web.

Vì vậy, chúng tôi tạo một dự án mới, lưu nó dưới bất kỳ tên nào và trước hết chỉ ra địa chỉ trang web ở đầu trang trong trường URL.

Tiếp theo, chúng tôi chỉ ra khu vực mà chúng tôi cần thu thập yêu cầu. Để thực hiện việc này, hãy nhấp vào từng nút Vùng ở cuối chương trình (tổng cộng có 4 vùng) và chọn vùng mong muốn trong cửa sổ xuất hiện. Chúng tôi sẽ cần nút đầu tiên để thu thập số liệu thống kê và dạng từ từ Yandex.Wordstat, nút thứ hai - để lấy tần số từ Yandex.Direct, nút thứ ba - để phân tích mức độ cạnh tranh và nút cuối cùng để thu thập số liệu thống kê từ Google.

Cài đặt cơ bản.

Bây giờ bạn cần thiết lập thống kê đọc từ Yandex. Nó được cấu hình theo mặc định, nhưng bạn cần thực hiện những thay đổi nhỏ tùy thuộc vào nhiệm vụ cụ thể là biên dịch lõi ngữ nghĩa.

Đầu tiên, chỉ định giới hạn tần số thấp hơn cho các cụm từ được thêm vào. Việc này được thực hiện trong bảng “Thêm cụm từ có tần số từ” vào bảng. Nếu mục tiêu của bạn là thu thập hàng nghìn truy vấn tần suất thấp, hãy đặt phạm vi gần đúng 5-50 . Nếu bạn cần thu thập các truy vấn tần suất cao, hãy đặt giới hạn tần suất thấp hơn từ 50. Trong tất cả các trường hợp khác, tham số mặc định là phù hợp - từ 10.

Sẽ rất hợp lý khi chọn hộp kiểm “Tự động ghi 0”. Trong trường hợp này, khi thu thập một số truy vấn tần suất thấp, sẽ không có kết quả trống.

Bạn có thể nhận thấy rằng chúng tôi đã để độ sâu phân tích bằng 0. Chẳng ích gì khi sử dụng độ sâu lớn hơn khi thu thập các truy vấn khu vực thông thường, vì các truy vấn thường nhỏ hơn 40 trang được đặt theo mặc định. Chỉ nên đặt độ sâu bằng 1 nếu nhiệm vụ là thu thập tối đa các khóa có liên quan cho các truy vấn tần suất rất cao, đồng thời bạn phải chỉ định một giá trị phù hợp, ví dụ: 100 trong mục “Không thêm cụm từ dành cho nghiên cứu chuyên sâu với tần số cơ bản bằng hoặc thấp hơn.”

Tôi thường tăng độ trễ giữa các yêu cầu một chút. Với giá trị 8000-15000, hình ảnh xác thực của tôi không bao giờ xuất hiện nếu không có bất kỳ máy chủ proxy nào và tốc độ ở mức chấp nhận được.

Nhưng nếu hình ảnh xác thực xuất hiện quá thường xuyên thì lựa chọn thông minh nhất tất nhiên là sử dụng máy chủ proxy, ở đây có proxy dành riêng cho Keycollector https://proxy-sale.com

Tất cả những gì còn lại là mở tab Yandex.Direct trong cùng cài đặt và thêm 5-6 tài khoản giả được tạo đặc biệt ở dạng địa chỉ:mật khẩu.

Chương trình đã được cấu hình và sẵn sàng thu thập từ khóa.

Bộ sưu tập các cụm từ khóa.

Cá nhân tôi thấy việc thu thập từ khóa là thuận tiện nhất cho một trang cụ thể. Mặc dù một số trình tối ưu hóa SEO trước tiên thích thu thập hàng nghìn cụm từ rồi phân tán chúng trên các trang bằng bộ lọc.

Trong bài viết này, tôi sẽ xem xét tùy chọn đầu tiên, vì nó đơn giản hơn và theo ý kiến ​​​​của tôi, chính xác hơn và thích hợp hơn khi biên soạn lõi để quảng cáo các trang web kinh doanh thông thường hoặc cùng một blog.

Nhấp vào biểu tượng bộ sưu tập số liệu thống kê Yandex.Wordstat và nhập danh sách các khóa phù hợp với trang hoặc phần của trang web đang được quảng cáo. Ở đây, bạn cần sử dụng trí tưởng tượng của mình một chút và nghĩ ra tất cả các loại từ có thể phản ánh bản chất trang của bạn và qua đó khách truy cập tiềm năng có thể tìm kiếm trang web được quảng cáo của bạn trong tìm kiếm.

Nếu trí tưởng tượng của bạn hạn chế, chỉ cần tìm thủ công các ví dụ về truy vấn tìm kiếm tương tự trong Yandex.

Tất nhiên, bạn có thể thu thập gợi ý bằng cách sử dụng cùng một chương trình KeyCollector, nhưng khi biên dịch lõi ngữ nghĩa cho một phần hoặc trang cụ thể, điều này thường không cần thiết và sẽ nhanh hơn nếu bạn chỉ cần nhập một vài từ chung chung, thường thì không có nhiều từ đó, chỉ 5-10 cho mỗi trang được quảng cáo.

Không cần phải lo lắng về phần cuối hoặc dạng từ, chương trình sẽ tìm thấy tất cả các tùy chọn - chỉ cần nhập từ chung nhất nhưng phù hợp về nghĩa và loại trừ các cách hiểu khác của từ.

Đối với một bài viết đánh giá về trao đổi liên kết vĩnh cửu, ban đầu tôi sử dụng những từ sau:

Nếu chỉ dùng từ “trao đổi” thì chương trình sẽ tạo ra rất nhiều thứ rác rưởi không phù hợp với nội dung bài viết của tôi, ví dụ như về chứng khoán, đầu cơ chứng khoán, trao đổi lao động, v.v. Và đối với truy vấn “trao đổi liên kết”, nhiều kết hợp đã được tìm thấy rất phù hợp với trang của tôi, bao gồm “trao đổi liên kết tốt nhất”, “trao đổi liên kết vĩnh viễn”, v.v.

Đồng thời, tốt nhất là chỉ sử dụng từ chung “miralinks” để tìm ra số lượng tùy chọn truy vấn lớn nhất có thể với từ này: xét cho cùng, nó chỉ được gõ bởi những người, về nguyên tắc, quan tâm đến điều này chủ đề cụ thể và không có chủ đề khác.

Chúng tôi sàng lọc những thứ không cần thiết.

Sau khi thu thập từ khóa bằng chương trình KeyCollector, danh sách tất cả các cụm từ được tìm thấy trong thống kê tìm kiếm tương ứng với các tham số đã định cấu hình sẽ xuất hiện trên tab hiện tại.

Trong số đó có 2 loại key không phù hợp để khuyến mãi:

  • Các khóa có số lần xuất hiện trực tiếp ít.
  • Khóa chứa từ khóa phủ định.

Các khóa có số lần xuất hiện trực tiếp ít.

Tôi đã viết trước đó rồi, bây giờ tôi sẽ chỉ nhắc lại một chút. Ban đầu, chương trình thu thập các truy vấn chính với tần số cơ bản. Điều này có nghĩa là số lượng phát hành của một yêu cầu cụ thể mỗi tháng sẽ bao gồm tất cả các dạng từ có yêu cầu này.

Ví dụ: yêu cầu “trao đổi mua liên kết” = 55 lần hiển thị mỗi tháng. Nhưng những lần hiển thị này sẽ bao gồm nhiều biến thể của truy vấn này, ví dụ: “đánh giá về sàn giao dịch mua liên kết” hoặc “trao đổi mua liên kết sape”, v.v.
Để quảng cáo một trang web, không thể sử dụng tất cả các tùy chọn này cùng một lúc, vì các truy vấn chính sẽ cần phải được viết bằng thẻ meta, có dung lượng rất nhỏ, được thêm vào các tiêu đề và tiêu đề phụ của trang, cũng không cao su , và không có quá nhiều thư rác, với mật độ bình thường, được nhập vào văn bản.

Do đó, điều hợp lý là chọn các truy vấn thường gặp nhất và tối ưu hóa trang dành riêng cho chúng để càng nhiều người truy cập vào trang được quảng cáo càng tốt. Có bao nhiêu lần hiển thị về “trao đổi mua liên kết” mà không có bất kỳ bổ sung hoặc biến thể nào? Để làm điều này, bạn cần thu thập dữ liệu với tần số được gọi là “!”.

Bắt đầu nào.
Nhấp vào biểu tượng Trực tiếp, chọn hộp kiểm bên cạnh “!word” và nhấp vào “Nhận dữ liệu”.

Như bạn có thể thấy, số lượng yêu cầu trực tiếp cho khóa “trao đổi mua liên kết” rất ít - chỉ 3 (!) yêu cầu mỗi tháng, thay vì 55. Vì vậy, cá nhân tôi không thấy việc tối ưu hóa trang cho yêu cầu này.

Do đó, điều quan trọng là phải lọc ra tất cả các truy vấn có ít lần xuất hiện chính xác trực tiếp trong tìm kiếm, chẳng hạn như nhỏ hơn 5. Để thực hiện việc này một cách nhanh chóng, chúng tôi chỉ cần sắp xếp tất cả các khóa được thu thập theo tần suất chính xác là “!”.

Sau đó chúng ta chọn những dòng chứa những từ có tần suất không đủ và xóa chúng.
10 giây và danh sách hàng trăm từ thường được giảm đi 3-5 lần. Bây giờ việc loại bỏ các khóa không liên quan còn lại là điều hợp lý.

Khóa có từ khóa phủ định.

Nó là gì? Đây là truy vấn tìm kiếm được sử dụng để tìm kiếm một trang không được quảng cáo và rõ ràng không phải là khách hàng tiềm năng.
Ví dụ: đối với một cửa hàng bán máy hút bụi, các truy vấn không liên quan như vậy có thể là các khóa có từ “hướng dẫn”, “đánh giá”,
Nghĩa là, yêu cầu “hướng dẫn sử dụng máy hút bụi Samsung” dường như không hữu ích đối với chủ một cửa hàng trực tuyến thông thường, bởi vì ngay cả khi có nhiều người xem qua nó, điều họ làm nhiều nhất là tải xuống những hướng dẫn này chứ không phải mua một chiếc máy hút bụi mới.

Trong trường hợp của tôi, việc xóa các khóa có từ “script”, “www”, v.v. là điều hợp lý.

Bắt đầu nào.
Nhấp vào nút “Dừng từ”. Trong cửa sổ xuất hiện, hãy nhập các từ phủ định, đảm bảo rằng loại tìm kiếm xuất hiện ở dưới cùng là “Dừng từ độc lập với dạng từ”. Điều này là cần thiết để không viết chính xác từng từ phủ định mà sử dụng các từ phủ định tổng quát hơn.
Trong trường hợp này, chẳng hạn như khi sử dụng từ khóa phủ định “hướng dẫn”, truy vấn tìm kiếm “hướng dẫn máy hút bụi”, “hướng dẫn tải xuống máy hút bụi”, v.v. sẽ bị xóa, tức là các truy vấn có bất kỳ dạng từ nào.

Nhấp vào “Đánh dấu trong bảng” và kết quả là tất cả các truy vấn chính chứa từ khóa phủ định đều được đánh dấu.

Bây giờ tất cả những gì còn lại là loại bỏ chúng.
Mở tab “Dữ liệu” ở trên cùng, chọn “Xóa các cụm từ đã đánh dấu” và thế là xong - bây giờ bạn có danh sách các khóa không có yêu cầu không liên quan.

Chúng tôi xác định mức độ cạnh tranh.

Một tính năng tuyệt vời của chương trình KeyCollector là phân tích dữ liệu về số lượng trang được lập chỉ mục được tìm thấy cho mỗi truy vấn tìm kiếm, số lượng trang web trong TOP 10 có chứa cụm từ khóa này trong tiêu đề của trang Tiêu đề và cũng có bao nhiêu trang web trong TOP 10 có chứa cụm từ khóa này trong tiêu đề của trang Tiêu đề. 10 trang hàng đầu cho những truy vấn này là các trang chính.

Rõ ràng là càng có nhiều trang được lập chỉ mục, tiêu đề và trang chính được tối ưu hóa trong kết quả tìm kiếm thì việc cạnh tranh với chúng sẽ càng khó khăn hơn.

Tuy nhiên, rất thường xuyên xảy ra tình huống trong đó các truy vấn tần suất cao tốt có mức độ cạnh tranh tương đối nhỏ. Do đó, điều rất quan trọng là phải phân tích tất cả các truy vấn khóa được thu thập về mức độ cạnh tranh để lựa chọn và quảng bá bằng cách sử dụng các khóa có lợi nhất nhưng vẫn chưa có người sử dụng.

Để thực hiện việc này, hãy nhấp vào biểu tượng “KEI” và chọn “Nhận dữ liệu cho Yandex PS”.
Tất nhiên, bạn có thể làm rõ mức độ cạnh tranh trong các công cụ tìm kiếm khác; điều này phụ thuộc vào nhiệm vụ quảng cáo, nhưng trong hầu hết các trường hợp, Yandex là đủ để có được bức tranh khách quan về khó khăn khi thúc đẩy một yêu cầu cụ thể.

Tất nhiên, mức độ định nghĩa về cạnh tranh này là không hoàn hảo. Sẽ thật lý tưởng nếu chương trình cũng có thể phân tích cú pháp cho từng yêu cầu:

  • TCI và PR trung bình của các trang web trong TOP 10.
  • Khối lượng trang trung bình.
  • Số lượng liên kết bên ngoài trung bình đến một đối thủ cạnh tranh, v.v.

Trong trường hợp này kết quả sẽ chính xác hơn.
Nhưng như thực tế cho thấy, ngay cả một phân tích cạnh tranh “ngoan thảo” như vậy cũng đủ để tìm thành công các từ khóa có lợi nhuận và nhanh chóng vượt qua chúng, vì nhiều trình tối ưu hóa hoàn toàn không tiến hành việc đó và kết quả là nhiều trang web được quảng bá dựa trên cạnh tranh phức tạp. các truy vấn, mặc dù chúng “nằm gần” các yêu cầu với tần suất không kém và hoàn toàn không có đối thủ cạnh tranh được tối ưu hóa.

Tôi bắt đầu viết bài này cách đây khá lâu, nhưng ngay trước khi xuất bản, hóa ra các đồng nghiệp trong nghề của tôi đã đi trước tôi và đăng những tài liệu gần như giống hệt nhau.

Lúc đầu, tôi quyết định sẽ không xuất bản bài viết của mình vì chủ đề này đã được các đồng nghiệp giàu kinh nghiệm hơn đề cập kỹ lưỡng. Mikhail Shakin nói về 9 cách giải quyết yêu cầu ở KC, Igor Bakalov quay video về việc phân tích các bản sao tiềm ẩn. Tuy nhiên, sau một thời gian, cân nhắc tất cả những ưu và nhược điểm, tôi đi đến kết luận rằng có lẽ bài viết của tôi có giá trị sống và có thể hữu ích cho ai đó - đừng phán xét khắt khe.

Nếu bạn cần lọc một cơ sở dữ liệu lớn gồm các từ khóa bao gồm 200 nghìn hoặc 2 triệu truy vấn thì bài viết này có thể giúp bạn. Nếu bạn làm việc với các lõi ngữ nghĩa nhỏ thì rất có thể bài viết sẽ không đặc biệt hữu ích cho bạn.

Chúng tôi sẽ xem xét việc lọc lõi ngữ nghĩa lớn bằng cách sử dụng ví dụ về mẫu bao gồm 1 triệu truy vấn về chủ đề pháp lý.

Chúng ta cần gì?

  • Người thu thập khóa (sau đây gọi tắt là KC)
  • RAM tối thiểu 8GB (nếu không chúng ta sẽ phải đối mặt với tình trạng phanh khủng khiếp, tâm trạng hư hỏng, hận thù, giận dữ và máu chảy trong mao mạch mắt)
  • Từ dừng chung
  • Kiến thức cơ bản về ngôn ngữ biểu thức chính quy

Nếu bạn hoàn toàn mới tham gia hoạt động kinh doanh này và không phải là bạn thân nhất của KC, thì tôi thực sự khuyên bạn nên tự làm quen với chức năng nội bộ được mô tả trên các trang chính thức của trang web. Nhiều câu hỏi sẽ tự biến mất và bạn cũng sẽ hiểu được đôi chút về lịch trình thường xuyên.

Vì vậy, chúng tôi có một cơ sở dữ liệu lớn về các khóa cần được lọc. Bạn có thể lấy cơ sở dữ liệu thông qua phân tích cú pháp độc lập, cũng như từ nhiều nguồn khác nhau, nhưng đó không phải là điều chúng ta đang nói đến hôm nay.

Mọi thứ được mô tả bên dưới đều có liên quan dựa trên ví dụ về một niche cụ thể và không phải là tiên đề! Trong các ngóc ngách khác, một số hành động và giai đoạn có thể khác biệt đáng kể! Tôi không giả vờ là một Chuyên gia ngữ nghĩa mà chỉ chia sẻ những suy nghĩ, phát hiện và cân nhắc của mình về vấn đề này.

Bước 1. Xóa ký tự Latin

Chúng tôi xóa tất cả các cụm từ có chứa ký tự Latinh. Thông thường, những cụm từ như vậy có tần suất không đáng kể (nếu có) và có thể mắc sai sót hoặc không liên quan.

Mọi thao tác lựa chọn theo cụm từ đều được thực hiện thông qua nút quý giá này

Nếu bạn lấy hạt nhân thứ một triệu và đạt đến bước này, thì ở đây các mao mạch ở mắt có thể bắt đầu vỡ ra, bởi vì. trên máy tính/máy tính xách tay yếu, mọi thao tác có ký hiệu lớn có thể, nên và sẽ chậm một cách vô lý.

Chọn/đánh dấu tất cả các cụm từ và xóa.

Bước 2. Loại bỏ đặc biệt. Biểu tượng

Thao tác này tương tự như xóa ký tự Latinh (bạn có thể thực hiện cả hai cùng một lúc), tuy nhiên, tôi khuyên bạn nên thực hiện từng bước một và xem kết quả bằng mắt, chứ không nên “chặt vai” vì đôi khi, ngay cả trong một lĩnh vực mà bạn dường như biết mọi thứ, vẫn có những truy vấn hấp dẫn có thể nằm trong bộ lọc mà bạn có thể không biết.

Một lời khuyên nhỏ, nếu bạn có nhiều cụm từ hay trong mẫu của mình, nhưng có dấu phẩy hoặc ký tự khác, chỉ cần thêm ký tự này vào các trường hợp ngoại lệ và thế là xong.

Một lựa chọn khác (cách samurai)

  • Tải xuống tất cả các cụm từ cần thiết có ký tự đặc biệt
  • Loại bỏ chúng trong KC
  • Trong bất kỳ trình soạn thảo văn bản nào, hãy thay thế ký tự này bằng dấu cách
  • Tải về nó trở lại.

Bây giờ các cụm từ nhỏ đã sạch sẽ, danh tiếng của chúng đã được nâng cao và một cuộc tuyển chọn đặc biệt đã được thực hiện. các biểu tượng sẽ không ảnh hưởng đến chúng.

Bước 3. Loại bỏ sự lặp lại của từ

Và một lần nữa chúng ta sẽ sử dụng chức năng được tích hợp trong KC bằng cách áp dụng quy tắc

Không có gì để thêm ở đây - mọi thứ đều đơn giản. Chúng tôi tiêu diệt rác mà không nghi ngờ gì.

Nếu bạn phải đối mặt với nhiệm vụ thực hiện lọc nghiêm ngặt và loại bỏ càng nhiều rác càng tốt, đồng thời hy sinh một số phần truy vấn tốt, thì bạn có thể kết hợp cả 3 bước đầu tiên thành một.

Nó sẽ trông giống thế này:

QUAN TRỌNG:Đừng quên chuyển "VÀ" thành "HOẶC"!

Bước 4. Xóa các cụm từ có từ 1 đến 7 từ trở lên

Ai đó có thể phản đối và nói về sự thú vị của các từ một từ, không vấn đề gì - hãy bỏ qua, nhưng trong hầu hết các trường hợp, việc lọc thủ công các từ một từ mất rất nhiều thời gian, theo quy luật, tỷ lệ tốt/xấu- từ ngữ là 1/20, không có lợi cho chúng tôi. Có, và đưa chúng lên TOP bằng cách sử dụng các phương pháp mà tôi thu thập những hạt nhân như vậy từ thể loại khoa học viễn tưởng. Vì vậy, với trái tim rung động, chúng ta gửi lời đến tổ tiên.

Tôi thấy trước câu hỏi của nhiều người là “tại sao lại xóa những cụm từ dài”? Tôi trả lời, các cụm từ bao gồm 7 từ trở lên phần lớn có cấu trúc spam, không có tần suất và nhìn chung có rất nhiều bản sao, đặc biệt là các bản sao theo chủ đề. Tôi sẽ đưa ra một ví dụ để làm cho nó rõ ràng hơn.

Ngoài ra, tần suất của những câu hỏi như vậy thấp đến mức không gian máy chủ thường đắt hơn lượng khí thải từ những yêu cầu như vậy. Ngoài ra, nếu bạn nhìn vào TOP các cụm từ dài, bạn sẽ không tìm thấy sự xuất hiện trực tiếp trong văn bản hoặc trong thẻ, vì vậy việc sử dụng các cụm từ dài như vậy trong SL của chúng tôi sẽ không có ý nghĩa gì.

Bước 5: Xóa các bản sao tiềm ẩn

Chúng tôi sắp xếp việc dọn dẹp trước, thêm các cụm từ của riêng mình, chỉ ra một liên kết đến danh sách của tôi, nếu bạn có điều gì cần bổ sung - hãy viết, chúng ta sẽ cùng nhau cố gắng để đạt được sự hoàn hảo.

Nếu chúng tôi không làm điều này và sử dụng danh sách được những người tạo ra KC vui lòng cung cấp và nhập vào chương trình theo mặc định, thì đây là những kết quả mà chúng tôi sẽ có trong danh sách và trên thực tế, đây là những kết quả rất trùng lặp.

Chúng ta có thể thực hiện phân nhóm thông minh, nhưng để nó hoạt động chính xác, chúng ta cần loại bỏ tần số. Và điều này, trong trường hợp của chúng tôi, không phải là một lựa chọn. Bởi vì Xóa tần số từ 1 triệu. chìa khóa, thậm chí với 100k - bạn sẽ cần một gói proxy riêng, tính năng chống hình ảnh xác thực và rất nhiều thời gian. Bởi vì Ngay cả 20 proxy cũng không đủ - trong vòng một giờ, hình ảnh xác thực sẽ bắt đầu xuất hiện, bất kể bạn nhìn nó như thế nào. Và nhân tiện, vấn đề này sẽ mất rất nhiều thời gian; ngân sách chống captcha cũng sẽ ngốn khá nhiều. Và tại sao lại loại bỏ tần số khỏi các cụm từ rác có thể được lọc ra mà không cần nỗ lực nhiều?

Nếu bạn vẫn muốn lọc các cụm từ bằng cách phân nhóm thông minh, loại bỏ tần số và loại bỏ dần rác, thì tôi sẽ không mô tả chi tiết quy trình - hãy xem video mà tôi đã liên kết ở đầu bài viết.

Dưới đây là các bước và cài đặt dọn dẹp của tôi:

Bước 6. Lọc theo từ dừng

Theo tôi, đây là điểm buồn tẻ nhất, hãy uống trà, hút thuốc (đây không phải là cuộc gọi, tốt hơn hết là bạn nên bỏ hút thuốc và ăn bánh quy) và với nguồn năng lượng tươi mới, hãy ngồi xuống để lọc cốt lõi ngữ nghĩa bằng cách sử dụng các từ dừng.

Không cần phải phát minh lại bánh xe và bắt đầu biên soạn danh sách các từ an toàn từ đầu. Có những giải pháp làm sẵn. Đặc biệt, ở đây đã quá đủ để bạn làm cơ sở.

Tôi khuyên bạn nên sao chép dấu hiệu vào PC của chính mình, nếu không, điều gì sẽ xảy ra nếu anh em nhà Shestakov quyết định giữ “sự quyến rũ của bạn” cho riêng mình và đóng quyền truy cập vào tệp? Như người ta thường nói, “Chỉ vì bạn hoang tưởng không có nghĩa là bạn không bị theo dõi…”

Cá nhân tôi đã tách các từ dừng thành các tệp riêng biệt cho một số tác vụ nhất định, một ví dụ trong ảnh chụp màn hình.

Tệp "Danh sách chung" chứa tất cả các từ dừng cùng một lúc. Trong Key Collector, mở giao diện stop word và tải danh sách từ file.

Tôi kiểm tra mục nhập một phần và đánh dấu vào ô “Chỉ tìm kết quả trùng khớp ở đầu từ”. Các cài đặt này đặc biệt có liên quan khi có một lượng lớn từ dừng do thực tế là nhiều từ bao gồm 3-4 ký tự. Và nếu thiết lập các cài đặt khác, bạn có thể dễ dàng lọc ra rất nhiều từ hữu ích và cần thiết.

Nếu chúng ta không đánh dấu vào ô trên, thì từ dừng thô tục “chết tiệt” sẽ được tìm thấy trong các cụm từ như “tư vấn bảo hiểm nhà nước”, “cách bảo hiểm tiền gửi”, v.v. và như thế. Đây là một ví dụ khác, từ “RB” (Cộng hòa Belarus) sẽ chỉ ra một số lượng lớn các cụm từ, chẳng hạn như “bồi thường thiệt hại, tham vấn”, “đưa ra yêu cầu bồi thường trong tố tụng trọng tài”, v.v. và như thế.

Nói cách khác - Chúng tôi muốn chương trình chỉ đánh dấu những cụm từ có từ dừng xuất hiện ở đầu từ. Lời lẽ nhức tai nhưng không thể bỏ lời khỏi bài hát.

Tôi cũng muốn lưu ý rằng cài đặt này dẫn đến sự gia tăng đáng kể thời gian cần thiết để kiểm tra các từ dừng. Với một danh sách lớn, quá trình này có thể mất 10 hoặc 40 phút và tất cả là do hộp kiểm này, giúp tăng thời gian tìm kiếm các từ 100 từ trong cụm từ lên mười lần hoặc thậm chí nhiều hơn. Tuy nhiên, đây là tùy chọn lọc thích hợp nhất khi làm việc với lõi ngữ nghĩa lớn.

Sau khi chúng ta xem qua danh sách cơ bản, tôi khuyên bạn nên kiểm tra bằng mắt để xem liệu có bất kỳ cụm từ cần thiết nào được đưa vào bản phân phối hay không và tôi chắc chắn rằng nó sẽ như vậy, bởi vì danh sách chung các từ dừng cơ bản không phổ biến và phải được xử lý riêng cho từng niche. Đây là nơi bắt đầu “khiêu vũ với tambourine”.

Chúng tôi chỉ để lại những từ dừng đã chọn trong cửa sổ làm việc, việc này được thực hiện như thế này.

Sau đó nhấp vào “phân tích nhóm”, chọn chế độ “theo từng từ riêng lẻ” và xem những gì thừa trong danh sách của chúng tôi do các từ dừng không phù hợp.

Chúng tôi loại bỏ các từ dừng không phù hợp và lặp lại chu trình. Vì vậy, sau một thời gian, chúng tôi sẽ “điều chỉnh” danh sách công khai phổ quát theo nhu cầu của mình. Nhưng đó không phải là tất cả.

Bây giờ chúng ta cần chọn các từ dừng được tìm thấy cụ thể trong cơ sở dữ liệu của chúng tôi. Khi nói đến cơ sở dữ liệu từ khóa khổng lồ, luôn có một số loại “rác có thương hiệu”, như tôi gọi. Hơn nữa, đây có thể là một tập hợp những điều vô nghĩa hoàn toàn không mong đợi và bạn phải loại bỏ nó một cách riêng lẻ.

Để giải quyết vấn đề này, chúng ta sẽ lại sử dụng chức năng Phân tích nhóm, nhưng lần này chúng ta sẽ xem xét tất cả các cụm từ còn lại trong cơ sở dữ liệu sau các thao tác trước đó. Chúng ta sẽ sắp xếp theo số lượng cụm từ và bằng mắt, vâng, vâng, vâng, bằng tay và mắt, chúng ta sẽ xem qua tất cả các cụm từ, tối đa 30-50 trong một nhóm. Ý tôi là cột thứ hai “số cụm từ trong nhóm”.

Tôi vội cảnh báo những người yếu tim, thanh trượt cuộn dường như vô tận” sẽ không buộc bạn phải mất một tuần để lọc, cuộn 10% và bạn sẽ tiếp cận các nhóm chứa không quá 30 truy vấn và việc lọc như vậy chỉ nên được thực hiện bởi những người biết nhiều về sự đồi trụy.

Trực tiếp từ cùng một cửa sổ, chúng ta có thể thêm tất cả rác vào từ dừng (biểu tượng cái khiên ở bên trái hộp chọn).

Thay vì thêm tất cả các từ dừng này (và còn nhiều từ khác, tôi chỉ không muốn thêm ảnh chụp màn hình dài theo chiều dọc), chúng tôi thêm “bộ lọc” gốc một cách khéo léo và ngay lập tức cắt bỏ tất cả các biến thể. Kết quả là danh sách từ dừng của chúng tôi sẽ không phát triển đến kích thước khổng lồ và quan trọng nhất là chúng tôi Chúng ta đừng lãng phí thêm thời gian để tìm kiếm chúng. Và đối với khối lượng lớn, điều này rất quan trọng.

Bước 7. Xóa các từ “word” 1 và 2 ký tự

Tôi không thể tìm ra định nghĩa chính xác cho kiểu kết hợp ký hiệu này nên tôi gọi nó là “từ ngữ”. Có lẽ ai đó đọc bài sẽ gợi ý thuật ngữ nào hay hơn và tôi sẽ thay thế. Đó là cách tôi bị trói lưỡi.

Nhiều người sẽ hỏi, “tại sao lại làm điều này”? Câu trả lời rất đơn giản, rất thường xuyên trong các mảng từ khóa như vậy có loại rác:

Đặc điểm chung của những cụm từ như vậy là có 1 hoặc 2 ký tự không có nghĩa (ảnh chụp màn hình hiển thị ví dụ có 1 ký tự). Đây là những gì chúng tôi sẽ lọc. Có những cạm bẫy ở đây, nhưng điều đầu tiên phải làm trước tiên.

Làm cách nào để xóa tất cả các từ có 2 ký tự?

Để làm điều này, chúng tôi sử dụng trình tự thông thường

Mẹo bổ sung: Luôn lưu các mẫu lịch trình thường xuyên của bạn! Họ được lưu không phải trong dự án, mà trong khuôn khổ KC nói chung. Vì vậy, họ sẽ luôn ở trong tầm tay.

(^|\s+)(..)(\s+|$) hoặc (^|\s)(1,2)(\s|$)

(st | fz | uk | trên | rf | liệu | bởi | st | không | un | đến | từ | cho | bởi | từ | về)

Đây là phiên bản của tôi, hãy tùy chỉnh nó cho phù hợp với nhu cầu của bạn.

Dòng thứ hai là ngoại lệ; nếu bạn không nhập chúng, thì tất cả các cụm từ chứa tổ hợp các ký tự từ dòng thứ hai của công thức sẽ được đưa vào danh sách có thể xóa.

Dòng thứ ba loại trừ các cụm từ mà ở cuối nó xuất hiện “рф”, bởi vì thường đây là những cụm từ bình thường, hữu ích.

Riêng biệt, tôi muốn làm rõ rằng tùy chọn (^|\s+)(..)(\s+|$) sẽ làm nổi bật mọi thứ - bao gồm các giá trị số. Mặc dù biểu thức chính quy (^|\s)(1,2)(\s|$) sẽ chỉ ảnh hưởng đến các chữ cái, nhưng tôi đặc biệt cảm ơn Igor Bakalov vì điều đó.

Chúng tôi áp dụng thiết kế của mình và loại bỏ các cụm từ rác.

Làm cách nào để xóa tất cả các từ có 1 ký tự?

Ở đây mọi thứ có phần thú vị hơn và không quá rõ ràng.

Lúc đầu, tôi đã cố gắng áp dụng và hiện đại hóa tùy chọn trước đó, nhưng kết quả là không thể loại bỏ hết rác, tuy nhiên, phương án cụ thể này sẽ phù hợp với nhiều người, hãy thử xem.

(^|\s+)(.)(\s+|$)

(với | trong | và | i | đến | y | o)

Theo truyền thống, dòng đầu tiên là dòng thông thường, dòng thứ hai là ngoại lệ, dòng thứ ba loại trừ những cụm từ trong đó các ký tự được liệt kê xuất hiện ở đầu cụm từ. Chà, điều đó hợp lý, vì chúng không có khoảng trắng ở trước, do đó, dòng thứ hai sẽ không loại trừ sự hiện diện của chúng trong mẫu.

Nhưng đây là tùy chọn thứ hai, trong đó tôi xóa tất cả các cụm từ có rác một ký tự, đơn giản và tàn nhẫn, trong trường hợp của tôi đã giúp tôi loại bỏ một lượng lớn các cụm từ thuận tay trái.

(j | c | e | n | g | w | )

Tôi đã loại trừ khỏi mẫu tất cả các cụm từ có “Moscow” xuất hiện, vì có rất nhiều cụm từ như:

nhưng tôi cần nó, bạn có thể đoán tại sao.

Sử dụng Key Collector, bạn không chỉ có thể đơn giản hóa đáng kể quy trình thu thập cốt lõi ngữ nghĩa cho chiến dịch quảng cáo mà còn nhận được kết quả và phân tích đầy đủ và chất lượng cao nhất.

Điều đáng chú ý là chương trình này không hoạt động với cơ sở dữ liệu làm sẵn và không tạo ra các cụm từ khóa mà thay vào đó, nó cho phép bạn thu thập thông tin liên quan trực tiếp từ các dịch vụ nguồn.

Ứng dụng này cho phép bạn lấy thông tin từ hầu hết các nguồn tiếng Nga và nước ngoài phổ biến nhất, với sự trợ giúp của nó, bạn có thể có được sự lựa chọn đầy đủ nhất về các cụm từ tần số cao, tần số trung bình và tất nhiên là cả tần số thấp.

Bạn có thể làm việc với các kết quả thu được mà không cần rời khỏi chương trình hoặc bằng cách xuất chúng sang định dạng Microsoft Excel hoặc CSV.

Trình bày dữ liệu dạng bảng cổ điển thuận tiện với khả năng lọc và trình chỉnh sửa bật lên bổ sung cho phép bạn phân tích thông tin bổ sung.

Key Collector được sử dụng tích cực không chỉ trong quảng cáo theo ngữ cảnh mà còn trong SEO.

Bạn có thể làm gì với Key Collector?

Thiết lập Key Collector để phân tích dữ liệu Wordstat Yandex

Trước tiên, bạn cần tải xuống - mua chương trình trên trang web sau: http://www.key-collector.ru/.

  1. 1 Đi tới cài đặt chương trình, nhưng để thực hiện việc này, bạn cần nhấp vào bánh răng nằm trong khối công cụ chương trình chính, ở góc trên bên trái, theo Hình 1.

Cơm. 1 - Thiết lập chương trình

  1. 2 Chọn tab “Phân tích cú pháp”, trong đó sẽ có thêm một số tab, từ đó chúng tôi chọn Yandex.Direct.

Cơm. 2 - Thiết lập phân tích cú pháp Yandex.Direct

  1. 3

    Chúng tôi đang thiết lập một tài khoản; để thực hiện việc này, bạn cần tạo một email trên Yandex, một email chỉ dành cho chương trình này để nó không bị chặn đột ngột, theo Hình 3.

    Điều đáng chú ý là cần phải có ủy quyền bắt buộc thông qua các tài khoản được tạo trong dịch vụ Yandex Direct.

Cơm. 3 - Thiết lập tài khoản Yandex.Direct

  1. 4 Sau khi mọi thứ đã được thiết lập, bạn cần bắt đầu một dự án mới, để thực hiện việc này, bạn cần nhấp vào “Dự án mới” và đặt tên cho nó theo Hình 4 và 5.

Cơm. 4 - Bắt đầu

Cơm. 5 - Tên dự án

  1. 5 Chúng tôi chỉ ra vùng phân tích cú pháp, trong trường hợp này là vùng “Ekaterinburg”. Để thực hiện việc này, bạn cần nhấp vào trường nhập tương ứng ở cuối chương trình, đối diện với biểu đồ màu đỏ và chọn thành phố được yêu cầu, theo Hình 6 và 7.

Cơm. 6 - Lựa chọn khu vực

Cơm. 7 - Chọn một vùng, ví dụ Ekaterinburg

  1. 6 Khởi chạy chương trình phân tích dữ liệu từ Yandex Wordstat để thực hiện việc này, hãy nhấp vào biểu tượng trên thanh công cụ dưới dạng biểu đồ màu đỏ, theo Hình 8.

Cơm. 8 - Khởi chạy để phân tích cú pháp

  1. 7 Trong cửa sổ đang mở, nhập danh sách các cụm từ khóa tần số cao hoặc trung bình chính đã được chọn thủ công để biên soạn cốt lõi ngữ nghĩa của các truy vấn và nhấp vào nút “Bắt đầu thu thập”, theo Hình 9.

Cơm. 9 - Hộp thoại nhập cụm từ khóa

  1. 8

    Sẽ mất một khoảng thời gian để chương trình hoàn tất việc thu thập dữ liệu.

    Kết quả là một danh sách một số lượng lớn các từ, theo Hình 10.

    Thời gian thu thập phụ thuộc vào khu vực đã chọn, cũng như từ khóa; hóa ra thời gian có thể mất từ ​​​​vài phút đến vài giờ.

Cơm. 10 - Danh sách thu thập tất cả các cụm từ khóa

  1. 9

    Chúng tôi loại bỏ những từ không liên quan và không hiệu quả sẽ không mang lại kết quả cho chiến dịch quảng cáo trong tương lai.

    Tất nhiên, bạn có thể lọc các cụm từ theo cách thủ công, nhấp vào từng cụm từ và chọn lọc ra, nhưng việc này sẽ mất rất nhiều thời gian, đặc biệt khi có tới vài trăm nghìn cụm từ. Do đó, chúng tôi sẽ sử dụng bộ lọc từ dừng đặc biệt cho việc này, điều này sẽ giúp giảm thời gian. Bạn phải nhấn vào biểu tượng stop word trong giao diện chương trình như Hình 11.

Cơm. 11 - Biểu tượng bộ lọc từ dừng

  • Có 2 tab với danh sách 1 và 2. Danh sách đầu tiên chứa các từ dừng không cần thiết không liên quan đến dự án, ngược lại, tab thứ hai bao gồm những từ có lợi cho dự án, theo Hình 12.

Cơm. 12 - Hai tab danh sách 1 và 2 “từ dừng”

  1. 10 Chúng tôi đặt cài đặt như trong ảnh chụp màn hình, các cài đặt như vậy cho phép bạn tìm kiếm kết quả phù hợp trong tất cả các cụm từ, tìm kiếm qua tất cả các từ của cụm từ, nếu cụm từ khớp một phần với từ dừng, các cụm từ khóa đó sẽ được đánh dấu trong phần chung bảng, tất nhiên, nếu bạn nhấp vào nút: “Đánh dấu trong bảng”, theo Hình 13. Tiếp theo, nhấp vào “Đánh dấu các cụm từ” trong bảng.

Cơm. 13 - Thiết lập “từ an toàn”

  1. 11

    Khi đã xác định được “các từ dừng”, các cụm từ được đánh dấu trong bảng có thể được xóa một cách an toàn bằng cách chọn tab “Dữ liệu” và nhấp vào “Xóa các cụm từ đã đánh dấu”, theo Hình 14.

    Kết quả là, bảng sẽ chứa những từ sẽ có hiệu quả hơn đáng kể cho dự án.

Cơm. 14 - Loại bỏ các cụm từ không cần thiết

  1. 12 Chúng tôi lấy tần suất chính xác của các cụm từ khóa để loại bỏ các từ giả. Để thực hiện việc này, chúng tôi sử dụng số liệu thống kê Yandex.Direct, cho phép bạn thu thập dữ liệu theo đợt, theo Hình 15.

Cơm. 15 - Thu thập tần suất của các cụm từ khóa

Ảnh chụp màn hình sau đây hiển thị dữ liệu được sắp xếp theo cột thứ hai “Tần suất” của các yêu cầu, theo Hình 16.

Cơm. 16 - Tần số ""

  1. 13 Tiếp theo, chúng tôi tải tất cả các cụm từ khóa lên định dạng Excel để tiếp tục xử lý các cụm từ như Hình 17.

Cơm. 17 - Xuất cụm từ khóa sang định dạng Microsoft Excel hoặc CSV

Bộ sưu tập theo mùa

Chương trình cho phép bạn thu thập thông tin về mức độ phổ biến của truy vấn trong khoảng thời gian qua, xây dựng biểu đồ dựa trên dữ liệu này và đưa ra giả định về tính thời vụ của một truy vấn nhất định dựa trên dữ liệu thu được.

Để thu thập thông tin về tính thời vụ của yêu cầu, hãy nhấp vào nút có biểu tượng biểu đồ trong nhóm nút “Thu thập từ khóa và thống kê”, theo Hình 18.

Cơm. 18 - Biểu tượng thời vụ

Khi thu thập thông tin về tính thời vụ của một yêu cầu, các giá trị của tần số trung bình số học và trung vị của nó cũng được tính toán. Bạn có thể thay đổi khoảng thời gian xem xét số liệu thống kê để tính toán các giá trị này trong cài đặt bộ sưu tập Yandex.Wordstat.

Nếu cần, bạn có thể lấy số liệu thống kê được nhóm theo tuần thay vì theo tháng. Trong trường hợp này, việc khởi chạy phải được thực hiện thông qua mục tương ứng trong menu thả xuống của nút thu thập dữ liệu thời vụ Yandex.Wordstat, theo Hình 19.

Cơm. 19 - Loại tính thời vụ trong bảng

Bạn có thể xem thông tin mở rộng về tính thời vụ bằng cách nhấp vào ô tương ứng với cụm từ này, theo Hình 20.

Cơm. 20 - Biểu đồ thời vụ

Nếu cần, bạn có thể xuất dữ liệu tần số mở rộng cho tất cả các cụm từ sang tệp CSV. Để thực hiện việc này, bạn cần sử dụng nút tương ứng trong menu thả xuống của nút bắt đầu thu thập theo mùa.

Thu thập số liệu thống kê từ các quầy của hệ thống thống kê Yandex.Metrika

Chương trình hỗ trợ thu thập số liệu thống kê từ các quầy của hệ thống thống kê Yandex.Metrika. Sử dụng Key Collector, bạn có thể thu thập từ và lưu lượng truy cập từ một bộ đếm được chỉ định.

Quá trình thu thập số liệu thống kê từ bộ đếm Yandex.Metrika

  1. 1 Bấm vào nút có logo dịch vụ trong nhóm nút “Thu thập từ khóa và thống kê” và nhập dữ liệu ủy quyền vào hệ thống thống kê, theo Hình 21 và 22.

Hình 21 - Nút thu thập số liệu thống kê từ bộ đếm của hệ thống thống kê Yandex.Metrika

* Để thu thập số liệu thống kê Yandex.Metrika, bạn phải đăng nhập vào tài khoản có quyền truy cập vào các bộ đếm cần thu thập số liệu thống kê. Chương trình hỗ trợ cả việc thu thập số liệu thống kê Yandex.Metrika thường xuyên và hàng loạt. Khi sử dụng bộ sưu tập thông thường, bạn có thể chọn trang web được yêu cầu từ danh sách thả xuống hoặc nhập ID của nó theo cách thủ công.

  1. 2 Chọn khoảng thời gian bạn muốn lấy số liệu thống kê. Bạn có thể tự nhập khoảng thời gian hoặc sử dụng mẫu (quý, năm, v.v.), theo Hình 22.
  • Tùy chọn "Cập nhật thống kê cho các cụm từ hiện có trong bảng" cho phép bạn cập nhật thống kê chuyển đổi cho các cụm từ đã tồn tại trước đó trong bảng. Ví dụ: trước đó trong bảng cụm từ “bút” đã được thêm vào. Nếu tùy chọn này bị tắt và mặc dù cụm từ này xuất hiện trong báo cáo, chương trình sẽ không ghi lại giá trị chuyển đổi cho nó. Nếu tùy chọn được bật, chương trình sẽ cập nhật giá trị này.
  • Tùy chọn "Không thêm cụm từ mới vào bảng" là tùy chọn bổ sung cho tùy chọn trước đó. Bằng cách bật nó lên, chương trình sẽ bị cấm thêm các cụm từ chưa từng có vào bảng trước đó. Điều này có thể hữu ích nếu bạn chỉ cần cập nhật hoặc thu thập dữ liệu nhấp qua cho số liệu thống kê được thu thập trước đó mà không làm loãng danh sách các cụm từ trong bảng bằng các cụm từ mới, sau đó có thể yêu cầu xử lý bổ sung.
  1. 3 Chọn phương thức lấy số liệu thống kê: trực tiếp bằng API hoặc dùng chương trình hàng ngày, theo Hình 22.
  • Trong trường hợp đầu tiên, chương trình chỉ cần tạo một yêu cầu tới API Yandex.Metrika, vượt qua ranh giới của khoảng thời gian thu thập trong các tham số. Đáp lại, cô nhận được một danh sách các cụm từ có số liệu thống kê chuyển đổi, danh sách này có thể được ghi ngay vào bảng dữ liệu. Chế độ này nhanh hơn, nhưng do đó, một số cụm từ tần số thấp có thể không được nhận do đặc thù của chính API.
  • Trong trường hợp thứ hai, chương trình xem số liệu thống kê cho khoảng thời gian đã chỉ định theo cách thủ công hàng ngày và sau đó, khi quá trình thu thập hoàn tất, sẽ tính toán các giá trị chuyển tiếp. Việc xem từng phần hàng ngày đôi khi cho phép bạn nhận được nhiều cụm từ hơn mà API thường không tạo ra (cụm từ tần suất thấp), nhưng việc này tốn nhiều thời gian hơn đáng kể. Cũng cần lưu ý rằng nếu quá trình thu thập bị gián đoạn thì số liệu thống kê về chuyển đổi và lỗi sẽ không được tính toán. Vì vậy, khi làm việc với chế độ này, bạn nên đợi cho đến khi quá trình thu thập hoàn tất.
  • Tùy chọn “Không thêm cụm từ nếu nó đã có trên bất kỳ tab nào khác” có thể hữu ích nếu bạn không muốn bảng không bao gồm các cụm từ đã được xử lý trên các tab khác.

Thu thập số liệu thống kê từ các bộ đếm của hệ thống thống kê Google.Analytics

Chương trình Key Collector hỗ trợ thu thập số liệu thống kê từ các bộ đếm của hệ thống thống kê Google.Analytics.

Sử dụng nó, bạn có thể thu thập các từ, số lượt truy cập, tỷ lệ thoát và trang đích từ một bộ đếm được chỉ định.

Quá trình thu thập số liệu thống kê từ bộ đếm Google.Analytics.

  1. 1 Nhấp vào nút có logo dịch vụ trong nhóm nút “Thu thập từ khóa và số liệu thống kê” và sau đó cửa sổ thu thập số liệu thống kê Google Analytics sẽ mở ra, theo Hình 23.

Hình 23 - Nút thu thập số liệu thống kê từ bộ đếm của hệ thống thống kê Google.Analytics

*Để thu thập số liệu thống kê Google Analytics, bạn phải cung cấp thông tin đăng nhập và mật khẩu cho tài khoản có quyền truy cập vào các bộ đếm mà từ đó số liệu thống kê sẽ được thu thập. Nếu muốn, bạn có thể bật tùy chọn "Lưu dữ liệu ủy quyền trong cài đặt chương trình".

Sau khi nhập thông tin đăng nhập và mật khẩu của bạn, hãy nhấp vào danh sách thả xuống với các trang web và chọn bộ đếm có số liệu thống kê bạn quan tâm.

Sau đó, chúng tôi chọn khoảng thời gian mà chúng tôi thu thập số liệu thống kê.

Bạn có thể tự nhập khoảng thời gian hoặc sử dụng mẫu (quý, năm, v.v.), theo Hình 24.

  • Tùy chọn "Cập nhật thống kê cho các cụm từ hiện có trong bảng" cho phép bạn cập nhật thống kê chuyển đổi cho các cụm từ đã tồn tại trước đó trong bảng.
  • Tùy chọn "Không thêm cụm từ mới vào bảng" là tùy chọn bổ sung cho tùy chọn trước đó. Bằng cách bật nó lên, bạn có thể ngăn chương trình thêm các cụm từ chưa có vào bảng trước đó. Điều này có thể hữu ích nếu bạn chỉ cần cập nhật hoặc thu thập dữ liệu nhấp qua cho số liệu thống kê được thu thập trước đó mà không làm loãng danh sách các cụm từ trong bảng bằng các cụm từ mới, sau đó có thể yêu cầu xử lý bổ sung.
  1. 2 Bạn cũng có thể chọn phương thức lấy số liệu thống kê: trực tiếp bằng API hoặc sử dụng chương trình hàng ngày, theo Hình 24.
  • Trong trường hợp đầu tiên, chương trình chỉ tạo một yêu cầu tới API Google.Analytics, vượt qua ranh giới của khoảng thời gian thu thập trong các tham số. Đáp lại, cô nhận được ngay một danh sách các cụm từ có số liệu thống kê về chuyển đổi, % số trang thoát và trang đích, có thể được ghi ngay vào bảng dữ liệu. Chế độ này nhanh hơn, nhưng do đó, một số cụm từ tần số thấp có thể không được nhận do đặc thù của chính API.
  • Trong trường hợp thứ hai, chương trình xem số liệu thống kê cho khoảng thời gian được chỉ định theo cách thủ công hàng ngày và sau đó, khi quá trình thu thập hoàn tất, sẽ tính toán các giá trị chuyển đổi và % lỗi. Việc xem từng phần hàng ngày đôi khi cho phép bạn nhận được nhiều cụm từ hơn mà API thường không tạo ra (cụm từ tần suất thấp), nhưng việc này tốn nhiều thời gian hơn đáng kể. Cần lưu ý rằng nếu quá trình thu thập bị gián đoạn thì số liệu thống kê về chuyển đổi và lỗi sẽ không được tính toán. Vì vậy, khi làm việc với chế độ này, bạn nên đợi cho đến khi quá trình thu thập hoàn tất.
  • Tùy chọn “Không thêm cụm từ nếu nó đã có trên bất kỳ tab nào khác” có thể hữu ích nếu bạn cần ngăn các cụm từ vào bảng đã được xử lý trên các tab khác.

Mẹo tìm kiếm

Chương trình hỗ trợ thu thập các mẹo tìm kiếm từ sáu công cụ tìm kiếm phổ biến: Yandex, Google, Mail, Rambler, Nigma, Yahoo, Yandex.Direct.

Để thu thập các mẹo tìm kiếm từ các công cụ tìm kiếm quan tâm, hãy nhấp vào nút có biểu tượng ba tổ ong nhiều màu trong nhóm nút “Bộ sưu tập từ khóa và thống kê” theo Hình 25.

Cơm. 25 - Nút “Gợi ý tìm kiếm”

Trong cửa sổ nhập từ hàng loạt mở ra, bạn có thể nhập các cụm từ quan tâm theo cách thủ công hoặc tải chúng từ một tệp. Trong trường hợp này, bạn có thể chọn nơi bạn muốn đặt kết quả phân tích cú pháp cho từng cụm từ đầu vào: trên tab hiện tại hoặc phân bổ trên một số tab. Sau đó, hãy chọn các hộp cho các công cụ tìm kiếm mà bạn muốn tìm kiếm và nhấp vào nút để bắt đầu thu thập thông tin (để hộp kiểm “Yandex.Direct” có sẵn, trước tiên bạn phải đăng ký một hoặc nhiều tài khoản trong “Cài đặt - Phân tích cú pháp - Yandex.Direct” "), theo Hình 26.

Hình 26 - Cửa sổ nhập hàng loạt từ để thu thập mẹo tìm kiếm

Điều đáng chú ý là việc thu thập mẹo từ Yandex.Direct có giới hạn rất nhỏ về số lượng yêu cầu. Bạn chỉ nên sử dụng bộ sưu tập đề xuất tìm kiếm từ Yandex.Direct cho một số cụm từ giới hạn nếu cần.

Tùy chọn “Với lựa chọn phần cuối của từ” cho phép bạn thu thập nhiều gợi ý hơn nữa do chương trình sẽ tự động chọn phần cuối của từ.

Việc lặp lại các phần cuối là vô ích nếu các từ hoàn chỉnh được chỉ định làm các từ đầu tiên, theo Hình 27.

Hình 27 - Thiết lập “mẹo tìm kiếm”

Điều đáng lưu ý là bạn không cần bật tùy chọn để chọn phần cuối trừ khi thực sự cần thiết, bởi vì việc sử dụng nó ảnh hưởng lớn đến số lượng yêu cầu được thực hiện và tổng thời gian cần thiết để hoàn thành một nhiệm vụ.

Key Collector hỗ trợ thu thập các truy vấn tìm kiếm tương tự từ kết quả tìm kiếm của Yandex, Google, Mail.

Để thu thập các mẹo tìm kiếm từ các công cụ tìm kiếm quan tâm, hãy nhấp vào nút trong nhóm nút “Thu thập từ khóa và thống kê”, theo Hình 28.

Hình 28 - Nút "Thu thập từ khóa và thống kê"

Trong cửa sổ nhập từ hàng loạt mở ra, bạn có thể nhập các cụm từ quan tâm theo cách thủ công hoặc tải chúng từ một tệp. Trong trường hợp này, bạn có thể chọn nơi bạn muốn đặt kết quả phân tích cú pháp cho từng cụm từ đầu vào: trên tab hiện tại hoặc phân bổ trên một số tab. Sau đó, bạn cần chọn các hộp của công cụ tìm kiếm mà bạn muốn tìm kiếm và nhấp vào nút để bắt đầu thu thập thông tin, theo Hình 29.

Hình 29 - Cửa sổ nhập từ hàng loạt

Tính toán dạng từ tốt nhất

Để thu thập các dạng từ tốt nhất cho các cụm từ khóa hiện có, hãy nhấp vào nút có logo dịch vụ trong nhóm nút “Bộ sưu tập từ khóa và thống kê” và chọn mục thích hợp trong menu thả xuống của nút, theo Hình 30 .

Hình 30 - Nút "Thu thập từ khóa và thống kê"

Bộ sưu tập tiện ích mở rộng cho cụm từ khóa

Để bắt đầu thu thập tiện ích mở rộng (cụm từ khóa mới) từ danh sách cụm từ hiện có, hãy nhấp vào nút có biểu tượng dịch vụ trong nhóm nút “Bộ sưu tập từ khóa và thống kê” và chọn mục thích hợp trong menu thả xuống của nút, theo Hình 31.

Hình 31 - Nút "Thu thập tiện ích mở rộng từ khóa"

Trong cửa sổ nhập hàng loạt mở ra, bạn có thể nhập các từ quan tâm theo cách thủ công hoặc tải chúng từ một tệp. Trong trường hợp này, bạn được lựa chọn vị trí đặt kết quả phân tích cú pháp cho từng cụm từ đầu vào: trên tab hiện tại hoặc được phân bổ trên một số tab. Sau khi nhấp vào nút bắt đầu quá trình, chương trình sẽ bắt đầu thu thập dữ liệu cho các cụm từ khóa được chỉ định, theo Hình 32.

Hình 32 - Cửa sổ nhập từ theo nhóm

Nếu bạn làm việc với các dự án lớn (hàng chục hoặc hàng trăm nghìn cụm từ) và thu thập các cụm từ ở chế độ hàng loạt, thì tùy chọn “Không cập nhật nội dung bảng sau các thao tác chèn và cập nhật nhóm trong quá trình phân tích cú pháp” trong “Cài đặt - Giao diện - Khác” có thể là hữu ích.

Vì vậy, bài viết này mô tả các khả năng của Key Collector cho quảng cáo theo ngữ cảnh, cũng như phương pháp làm việc về cách bạn có thể tạo lõi ngữ nghĩa (tạo lõi ngữ nghĩa cũng cần thiết trong SEO) cho chiến dịch quảng cáo sử dụng các cụm từ khóa được phân tích cú pháp từ Yandex Wordstat .

Ngoài ra, chúng tôi có thể xác định những từ giả sẽ không có hiệu quả đối với Cộng hòa Kazakhstan.