Máy tính điều khiển giọng nói. Tổng quan về Trợ lý giọng nói miễn phí cho PC bằng tiếng Nga

Đối với những người khuyết tật, cũng như đơn giản cho Sibarites, các nhà phát triển hệ điều hành đã tạo điều khiển giọng nói của máy tính. Nó cho phép người dùng nhập thông tin bằng giọng nói. Sau khi phát âm các từ nhất định, thiết bị bắt đầu nhận dạng lời nói - chuyển đổi tín hiệu âm thanh thành thông tin kỹ thuật số. Sau khi thông tin được ghi nhận được công nhận chính xác - chương trình tiến hành theo thuật toán hành động được chỉ định - thực hiện một hàm được đính kèm với lệnh này hoặc một lệnh khác.

Mọi thứ đều đủ đơn giản. Do đó, không phải lúc nào cũng được ghi nhận chính xác, do đó, để giải quyết các nhiệm vụ phức tạp để quản lý hệ điều hành, chương trình quản lý giọng nói của máy tính được sử dụng mạnh mẽ. Nó được sử dụng để thực hiện các chức năng cơ bản: mở và đóng tệp, tìm kiếm cục bộ và mạng, v.v.

Lịch sử quản lý giọng nói

  • Hệ thống nhận dạng giọng nói Audrey đầu tiên được tạo ra trong những năm 50 của thế kỷ XX. Nó chỉ giải mã những con số được nói bởi một giọng nói.
  • Năm 1962, hệ thống nhận dạng từ đầu tiên đã được tạo ra. Cô đã giải mã 15 từ tiếng Anh nói.
  • Với sự phát triển của máy tính vào năm 1990, Rồng Dictate đã được phát triển. Cô nhận ra tới 100 từ mỗi phút, nhưng khác nhau với giá cao.
  • Vào đầu những năm 2000, một ứng dụng xuất hiện trong iPhone để nhận ra bài phát biểu tìm kiếm Google Voice. Trong năm 2010, hệ thống tìm kiếm đã được thêm vào Android.
  • Siri được bao gồm trong phần mềm điện thoại 4S vào đầu tháng 10 năm 2011;
  • năm 2014, Cortana đã được trình bày - Trợ lý giọng nói cho Windows.

Cortana và giọng nói tham gia các khả năng ngày hôm nay

"Cortana" là một trợ lý ảo trong hệ điều hành Windows. Dịch vụ giúp người dùng lập kế hoạch của các trường hợp, nhắc nhở họ.
Với một truy vấn nhất định, dịch vụ sẽ giúp thu thập thông tin cụ thể, tạo cấu trúc rõ ràng và trình bày nó cho người dùng càng tốt trong biểu mẫu được xử lý nhiều nhất.
Thật thú vị, cùng một lúc, khi bạn bật Trợ lý ảo thu thập tất cả thông tin về các yêu cầu được nhập, dữ liệu cá nhân, cố gắng thích ứng với từng cá nhân càng tốt.


Điều khiển giọng nói của điều khiển giọng nói của Windows 7 thông qua việc sử dụng trình trợ giúp ảo là không thể - nó chỉ được tích hợp vào phiên bản thứ mười. Nhưng, bất kể xin lỗi thế nào, các nhà phát triển đã không bận tâm để phát hành phiên bản tiếng Nga.
Vai trò chính được phát bởi tìm kiếm, trong 10 ke có thể được mở thông qua "Bắt đầu". Tính năng này xác định hầu hết mọi yêu cầu. Nếu mục nhập không được nhận dạng - bạn có thể nhập lệnh thích hợp vào cửa sổ bật lên và chương trình quản lý giọng nói của máy tính xem xét thông tin văn bản.

Một khoảnh khắc khó chịu là thu thập tất cả dữ liệu được nhập thông qua bàn phím và gửi chúng đến Microsoft.

Chương trình của bên thứ ba

Typle.

Sau khi hoàn tất cài đặt, hãy chuyển đến bước tiếp theo - Tạo một tài khoản. Ở đây cần phải đưa ra một cụm từ chính, sau đó một thông báo kích hoạt sẽ phát ra âm thanh.


Tiếp theo sẽ cần phải đưa ra và tạo các lệnh thoại, bất kể mục đích của họ. Lệnh "Dog" có thể chạy ứng dụng hoặc thực hiện một hành động hoàn toàn khác.




Bạn chỉ cần tạo một lệnh thoại và củng cố nó cho một hành động cụ thể. Nó phù hợp để thực hiện các hoạt động cơ bản - mở tệp, thư mục, v.v. Chức năng bị hạn chế.

LOA

Ở đây chức năng rộng hơn trong typle.


Điều khiển giọng nói của Windows 10 cung cấp cho người dùng mở và đóng các tệp, chụp ảnh ảnh chụp trạng thái màn hình, tắt PC.


Nhận dạng giọng nói xảy ra trong một thời gian dài, hơn 3-4 giây. Điều này là do thực tế là đầu tiên được chuyển đổi thành văn bản và các đội được máy tính nhận ra với thông tin văn bản.

Sai lầm

Đây là một chương trình miễn phí cho phép bạn quản lý PC và văn bản ra lệnh. Sau khi cài đặt, bạn phải đăng ký và sau đó bạn có thể thưởng thức.


Chức năng bảo vệ tự động thú vị khi gõ. Bạn có thể nói "trích dẫn" và ký tự tương ứng xuất hiện trong văn bản.

Khả năng quản lý giọng nói thông qua Yandex.stark

Thông qua việc sử dụng ứng dụng này, bạn có thể thực hiện tìm kiếm cục bộ hoặc mạng cho thông tin và tệp, khởi động lại hoặc tắt máy tính. Có một chức năng mở các chương trình và trang web.
Để sử dụng chương trình, trước tiên bạn phải tải xuống và cài đặt nó.

Nhưng khi cài đặt, cần phải loại bỏ các ve đối diện với các mục trong đó nhà sản xuất phần mềm cung cấp để cài đặt trình duyệt, thay đổi cài đặt của nó. Nếu không, việc cài đặt sẽ mất nhiều thời gian và cấu hình hơn sẽ thay đổi trong trình duyệt.
Cuối cùng, chuỗi được đặt gần nút "Bắt đầu". Nói cho tôi biết "Nghe Yandex" và cửa sổ sẽ mở ra.

Hãy yêu cầu.

Sau khi tạm dừng trong trình duyệt, chuỗi tìm kiếm sẽ mở. Được chấp nhận quản lý tìm kiếm theo cách này.
Nói chung, việc quản lý giọng nói của máy tính chưa được phát triển, vì nó thu hút chúng ta trong trí tưởng tượng. Nhưng những chức năng đó phải hẹn hò đã rất ấn tượng và giúp đỡ đáng kể để đi đến một mức độ sử dụng mới của PC.

Ngày tuyệt vời!

Ngày nay, những người giúp đỡ bằng giọng nói đã trở thành một phần không thể thiếu trong cuộc sống. Mỗi ngày, ngày càng nhiều người chọn trợ lý ảo, thay thế chuột và bàn phím. Trí tuệ nhân tạo giúp giải quyết các tác vụ đơn giản bằng cách sử dụng đầu vào bằng giọng nói. Sau khi nhập thông tin, trợ lý nhận ra bài phát biểu đã nói và bắt đầu hoạt động. Nói rõ ràng và rõ ràng để trợ lý hoàn thành đầy đủ yêu cầu. Anh ấy có thể đề xuất một tuyến đường, tin tức ngày, tìm nhạc, hiển thị thời tiết, trả lời một câu hỏi đơn giản. Những người trợ giúp bằng giọng nói phổ biến nhất cho PC: Cortana, Lyple, Loa, OK Google, Gorynych,.

Cortana cho Windows.

"Cortana" là một trợ lý giọng nói được tích hợp vào hệ điều hành và được tạo bởi Microsoft. Trợ lý này chủ yếu dành cho Windows, nhưng cũng như các ứng dụng chạy trên iOS, nền tảng Android, Xbox One, Microsoft Phone, Microsoft Band. "Cortana" sẽ giúp hệ thống hóa và lập kế hoạch cho các nhiệm vụ và kế hoạch của bạn trong một khoảng thời gian nhất định, hãy nhớ lại việc thực hiện bất kỳ hành động nào, cung cấp thông tin theo yêu cầu của bạn. Cũng có chức năng tích hợp để trả lời các câu hỏi phổ biến bằng cách tìm kiếm Bing. Các chức năng bao gồm một tuyến đường đặt, thông tin về tình trạng đường bộ, sẽ giúp không bị trễ. Bạn có thể nhập thông tin bằng giọng nói và bàn phím ở dạng văn bản. Cô ấy ủng hộ cuộc trò chuyện: hát bài hát, gửi truyện cười - không có khiếu hài hước.

Các đặc điểm bao gồm một chức năng như sự thịnh hành của mong muốn của người dùng. Nếu bạn có quyền truy cập vào dữ liệu cá nhân, Trợ lý ảo từ Microsoft sẽ "thích nghi" dưới bạn, liên tục phân tích hành động của bạn: những nơi bạn thích được; Sở thích của bạn trong một số điều nhất định; Lợi ích lâu dài của bạn, sở thích và nhiều hơn nữa.

Trợ lý ảo của Cortana có liên quan chặt chẽ với hệ điều hành và có thể quản lý Windows 10 và các ứng dụng riêng lẻ trong công việc của bạn: Trợ giúp Đọc email, vị trí theo dõi của bạn, kiểm tra danh sách các liên hệ, theo dõi lịch, quản lý nhạc và lời nhắc, bao gồm nhiều ứng dụng âm nhạc và Kiểm soát âm thanh theo sở thích của người dùng.

Có thể đồng bộ hóa nhiều thiết bị. Cortana sẽ duy trì sự liên quan trên nhiều máy tính cùng một lúc.

Alice Yandex (phiên bản máy tính để bàn)

Alice. - Trợ lý giọng nói, và. Alice có thể hiển thị dự báo thời tiết, tìm dữ liệu trên các địa điểm công cộng, để tìm nhạc, thực hiện chuyển đổi tiền tệ, giải quyết các tính toán toán học đơn giản và có thể hỗ trợ cuộc trò chuyện. Chương trình còn rất trẻ và tất cả thời gian đang được cải thiện. Alice cho phép bạn tiến hành một cuộc đối thoại ở dạng văn bản và giọng nói. Trợ lý giọng nói của Alice có thể hiểu ý nghĩa của các cụm từ của bạn: "Tôi có thể cảm thấy ở đây ở đâu?", Cô hiểu: "Các cửa hàng ở đâu?".

Tìm kiếm hàng yandex hoặc tên khác - yandex.strock Nằm trong thanh tác vụ hệ điều hành Windows. Hàng tìm kiếm của Yandex có thể tìm thấy thông tin mà người dùng đang ở trong Internet mà người dùng được nhập bởi phiếu bầu hoặc văn bản. Người dùng có thể đặt lệnh để mở bất kỳ thư mục và tài liệu nào nằm trên máy tính. Chương trình mở trên máy tính xách tay bằng cách nhấn nút chuỗi hoặc phím nóng. Trên thực tế, nó là một trường hợp đặc biệt của Alice cho PC. Để tiết kiệm dung lượng trên thanh tác vụ 8 cm, nút được thay thế bằng biểu tượng micrô. Đọc thêm nhiều cách để hiển thị trợ lý trên PC trong bài viết.

Typle - máy tính điều khiển bằng giọng nói

Chương trình được thiết kế cho hệ điều hành Windows. Nó không cần kiến \u200b\u200bthức về tiếng Anh, không có khả năng làm việc với người chơi và không có nhận thức về mẫu văn bản. Do số lượng chức năng hạn chế, chương trình dường như không hiệu quả và chức năng sử dụng. Các hạn chế của trợ lý là chỉ mở các tiện ích và trang internet. Chương trình hiểu tiếng ồn từ bên ngoài, như một lệnh để thực thi, tại sao máy tính không thể hoạt động chính xác. Trợ lý giọng nói nhanh chóng đáp ứng các nhiệm vụ. Sau khi tải xuống chương trình, bạn có thể đưa ra tuyên bố chính, cung cấp tín hiệu.

Gorynych.

Phát triển trong nước của Trợ lý giọng nói, để quản lý PC hệ điều hành Windows 7, XP, Vista. Kích thước 30,4 MB. Tiếng Nga và tiếng Anh. Ý tưởng này dựa trên ứng dụng "Dragon Dictate", được tạo ra bởi các chuyên gia phương Tây. Trợ lý giọng nói thực hiện tất cả các đội trung bình thực hiện các tương tự của nó. Sử dụng giọng nói, người dùng có thể mở bất kỳ thư mục nào trong máy tính. Tính năng này tương tự như chức năng từ chương trình typle. Một tính năng của Trợ lý giọng nói "Gorynych" được coi là nhập văn bản trong Word bằng giọng nói của chính họ. Trừ một chức năng như vậy là lời nói của người dùng nên không có lỗi và rõ ràng. Theo thời gian, chương trình ghi nhớ giọng nói của chủ sở hữu máy tính và bắt đầu thực hiện các lệnh nhanh hơn.

Loa - Máy tính điều khiển bằng giọng nói

Loa - Trợ lý giọng nói và phần mềm được sử dụng trong hệ điều hành Windows. Phần mềm khác với phần còn lại của chức năng rộng hơn. Người dùng có thể mở và đóng các thư mục khác nhau trên PC, tạo ảnh màn hình. Để làm việc với "Loa", bạn cần phải có kết nối internet ổn định. Chương trình được điều khiển bởi bàn phím, không phải lúc nào cũng thuận tiện. Chức năng giọng nói khiến nhiều thứ mong muốn: Xử lý giọng nói đúng giờ mất 5 giây, dài. Chương trình chuyển đổi bài phát biểu thành văn bản.

Ok google cho pc

Được rồi Google - Trợ lý giọng nói và đồng thời một phần của công cụ tìm kiếm. Chương trình có nhiều tính năng: lập kế hoạch sự kiện (cài đặt lời nhắc), theo dõi gửi thư, chuyển sang bất kỳ trang web nào, tìm kiếm các tác phẩm âm nhạc, tìm địa chỉ của các địa điểm công cộng, v.v. Tính năng của chương trình: Sau khi thực hiện lệnh, chương trình bổ sung thông tin chinh no. Chương trình có lợi thế: Công việc miễn phí và ổn định. Nhược điểm: Cấu hình chi tiết của chương trình. Trợ lý được tích hợp vào trình duyệt Google Chrome, có sẵn cho PC, Android, iOS.

Siri trên máy tính

Siri là một trợ lý giọng nói làm việc trên các thiết bị của Apple: IOS, iPhone, iPad và iPod Touch và máy tính xách tay với MacOS Sierra. Siri được đặt theo mặc định trên các tiện ích "Apple", tất cả những gì bạn cần là kích hoạt nó trong cài đặt thiết bị.

Sử dụng trình giả lập có thể được cài đặt trên Windows 7-10, kích thước tệp là 79 MB. Chương trình chuyển đổi một bài phát biểu của con người, sau đó đưa ra các khuyến nghị của người dùng. Trợ lý Mỹ có thể thực hiện các lệnh đơn giản, như những người khác. Tuyệt vời "hiểu" bài phát biểu của Nga. Bạn cần kết nối với Internet.

Cùng đọc:

Đã không tìm thấy câu trả lời, viết bình luận hoặc phản hồi.

Nhận dạng giọng nói là một công cụ Windows đơn giản và đa chức năng mà bạn có thể điều khiển máy tính bằng lệnh thoại.

Bạn có thể định cấu hình tính năng này để điều hướng, khởi chạy các ứng dụng, ra lệnh của văn bản và thực hiện nhiều tác vụ khác. Tuy nhiên, nhận dạng giọng nói được thiết kế chủ yếu cho những người khuyết tật không thể sử dụng chuột hoặc bàn phím.

Trong hướng dẫn này, chúng tôi cung cấp các bước để thiết lập và vận hành các tính năng nhận dạng giọng nói để bạn chỉ có thể quản lý máy tính bằng giọng nói.

Thật không may, công cụ này, như Kortan, rất hạn chế trong khu vực của chúng tôi.

Tuy nhiên, bạn có thể thay đổi một số cài đặt máy tính. Để làm điều này, hãy làm theo các bước sau:


Quan trọng! Vì vậy, tất cả mọi thứ hoạt động đúng đắn, bạn nên sử dụng không phải là tài khoản cục bộ, nhưng Microsoft! Nếu bạn có phiên bản của hệ thống cho một ngôn ngữ (nhấp chuột phải vào máy tính này, sau đó "Thuộc tính"), thì bạn sẽ không thể sử dụng Cortana hoặc một công cụ nhận dạng giọng nói đầy đủ!

Để thuận tiện, tất cả các hành động được dịch sang tiếng Nga và kèm theo các ảnh chụp màn hình tương ứng bằng tiếng Anh. Một cách thức triệt để hơn nếu không có gì giúp là cài đặt Windows cho Hoa Kỳ.

Thực hiện theo các bước sau:

  1. Mở bảng điều khiển.

  2. Tìm các tính năng đặc biệt của người Viking.

  3. Nhấp vào liên kết Khởi chạy nhận dạng giọng nói.

    Quan trọng! Ở đây, người dùng của chúng tôi phải đối mặt với một vấn đề, vì vậy hãy nhấp vào liên kết đến bên trái "chuyển đổi văn bản thành lời nói" và ngay lập tức đi đến phần của bài viết này cách thay đổi cài đặt nhận dạng giọng nói. Nếu bạn có giao diện hệ thống tiếng Anh, thì một cách an toàn, tiếp tục thực hiện các hành động kèm theo ảnh chụp màn hình bằng tiếng Anh.

  4. Trên trang Cài đặt, nhấp vào "Tiếp theo".
  5. Chọn loại micrô mà bạn sẽ sử dụng.

    Ghi chú! Micro để bàn không hoàn hảo, vì vậy Microsoft khuyên bạn nên sử dụng micrô ngoài hoặc tai nghe đặc biệt.

  6. Nhấn tiếp". Lặp lại hành động.

  7. Để kiểm tra hiệu suất của công cụ, hãy đọc to văn bản. Nhấn tiếp". Lặp lại hành động.

  8. Nhận dạng giọng nói có quyền truy cập vào tài liệu và email. Nó là cần thiết để cải thiện độ chính xác nhận dạng dựa trên các từ bạn sử dụng. Chọn tùy chọn Bật Tài liệu Xem hoặc ngắt kết nối nếu bạn có bảo mật. Nhấn tiếp".

  9. Chọn Chế độ kích hoạt: Sử dụng "Chế độ kích hoạt thủ công" - Nhận dạng giọng nói vô hiệu hóa lệnh "dừng nghe". Để bật lại, bạn cần nhấn nút micrô hoặc sử dụng tổ hợp phím Ctrl + Win; hoặc "Kích hoạt bằng giọng nói ». Công cụ nhận dạng đi vào chế độ ngủ khi không được sử dụng. Để bật lại, bạn cần gọi lệnh thoại "Bắt đầu nghe". Nhấn tiếp".

  10. Để tìm hiểu thêm về các lệnh thoại mà bạn có thể sử dụng, hãy nhấp vào nút Xem nền. Nhấn tiếp".

  11. Tùy chọn, bạn có thể chọn tùy chọn "Tự động khởi động chức năng nhận dạng giọng nói. Nhấn tiếp".

  12. Để truy cập hướng dẫn của Microsoft, nhấp vào nút Bắt đầu đào tạo hoặc chọn "Bỏ qua". Cuối cùng, bạn hoàn thành cài đặt.

Sau khi thực hiện các bước này, bạn có thể tiến hành sử dụng các tính năng nhận dạng giọng nói bằng các lệnh thoại. Ở trên cùng của màn hình sẽ xuất hiện các điều khiển.

Ghi chú! Bạn có thể kéo và kết nối giao diện nhận dạng giọng nói ở bất cứ đâu trên màn hình.

Cách giáo dục nhận dạng giọng nói và cải thiện độ chính xác

Sau khi quá trình đào tạo được hoàn thành, công cụ nhận dạng giọng nói nên hiểu rõ hơn giọng nói của bạn.

Cách thay đổi cài đặt nhận dạng giọng nói

Nếu bạn cần thay đổi bất kỳ tùy chọn nào, hãy làm theo các bước sau:

Bước 1. Mở bảng điều khiển.

Bước 2. Nhấp vào "Tính năng đặc biệt".

Bước 3. Chọn "Nhận dạng giọng nói".

Bước 4. Nhấp vào ngăn bên trái trên liên kết văn bản của các tham số giọng nói bổ sung.

Bước 5. Trong cửa sổ Thuộc tính trên tab Nhận dạng giọng nói, bạn có thể định cấu hình các thành phần khác nhau của hàm, bao gồm:

Bước 6. Trên văn bản trong tab Speech, bạn có thể quản lý cài đặt giọng nói, bao gồm:

Bước 7. Ngoài ra, bạn luôn có thể mở menu ngữ cảnh bằng nút chuột phải và truy cập tất cả các chức năng khác nhau và cài đặt công cụ nhận dạng giọng nói.

Cách sử dụng nhận dạng giọng nói trong Windows 10

Mặc dù một quá trình học tập nhỏ, nhận dạng giọng nói sử dụng các lệnh rõ ràng và dễ nhớ. Ví dụ: "Bắt đầu" sẽ mở menu tương ứng và "Hiển thị máy tính để bàn" biến tất cả các cửa sổ.

Sử dụng chức năng nhận dạng giọng nói, bạn có thể thực hiện các tác vụ cần thiết.

Bắt đầu công cụ nhận dạng giọng nói


Bật và tắt

Để sử dụng tính năng này, tùy thuộc vào cấu hình, nhấn nút micrô hoặc cho bạn biết để bắt đầu nghe.

Theo cùng một cách, bạn có thể vô hiệu hóa nó bằng cách nói "Dừng" hoặc nhấn nút micrô.

Sử dụng các lệnh

Một trong những đội được sử dụng thường xuyên nhất là:

  • "Mở" (Mở) - Chạy ứng dụng sau khi truy cập từ "Mở", theo sau là tên ứng dụng. Ví dụ: "Mắt mở" hoặc "Mở Firefox";
  • "Chuyển sang" (Chuyển sang) - Chuyển đến một ứng dụng đang chạy khác. Nói lệnh "chuyển đổi", theo sau là tên ứng dụng. Ví dụ: "Chuyển sang Microsoft Edge";
  • quản lý một cửa sổ mở. Để quản lý cửa sổ đang hoạt động, hãy sử dụng lệnh "sụp đổ", "Tối đa hóa" và "khôi phục" (tối thiểu hóa, tối đa hóa và khôi phục);
  • cuộn (cuộn). Cho phép bạn cuộn trang. Chỉ cần sử dụng lệnh "cuộn xuống" hoặc "cuộn lên" ("cuộn lên"), "Cuộn sang trái" ("cuộn sang trái") hoặc "cuộn sang phải" ("cuộn sang phải"). Bạn cũng có thể chỉ định một cuộn dài. Ví dụ: giả sử: "Cuộn xuống hai trang" ("cuộn xuống hai trang");
  • Đóng ứng dụng (đóng). Nói lệnh "Đóng" ("Đóng"), và sau đó là tên của ứng dụng đang chạy. Ví dụ: "Đóng từ" ("Đóng từ");
  • nhấp chuột (nhấp chuột). Bên trong ứng dụng, bạn có thể sử dụng lệnh nhấp (nhấp vào "), theo sau là tên của mục. Ví dụ: trong Word, bạn có thể nói "Nhấp vào Bố cục" ("Nhấp vào bố cục") và sự công nhận của bài phát biểu sẽ mở tab "Bố cục". Tương tự, bạn có thể sử dụng các lệnh "nhấp đúp" ("nhấp đúp") hoặc "nhấp chuột phải" ("nhấp chuột phải");
  • nhấn (nhấn). Lệnh này khởi chạy các phím nóng. Ví dụ: để mở "Trung tâm hành động". Nói "Nhấn Windows A" ("nhấn Windows A").

Sử dụng dictation.

Nhận dạng giọng nói cũng bao gồm khả năng chuyển đổi giọng nói thành văn bản bằng chức năng đọc chính tả và tự động hoạt động.


Trợ lý Microsoft A.K.A. Cortana (Cortana)

Để đáp ứng sự mong đợi của người dùng và chứng minh khả năng cạnh tranh so với các công ty như Apple, Google hoặc Amazon, Microsoft đã giới thiệu trợ lý thông minh của mình Kortan.

Trong giai đoạn đầu, ông được coi là một trong những trợ lý nhân tạo tốt nhất, nhưng mất tình trạng sau khi mất phiên bản di động của Microsoft trong trận chiến với Android và iOS. Tuy nhiên, ở đây chúng tôi có nghĩa là Windows 10, vì vậy Cortana và bây giờ là một công cụ khá khả thi.

Chúng tôi hy vọng rằng theo thời gian anh ấy sẽ cải thiện. Cortana rất hữu ích nếu bạn muốn chạy máy tính của mình mà không cần bất kỳ lệnh thoại nào.

Dưới đây là cách bật và định cấu hình nó để sử dụng sau này trong Windows 10:

  1. Nhấp vào "Bắt đầu" và mở "Tất cả các ứng dụng".

  2. Tìm Cortana và mở nó.

  3. Xóa công tắc thành "Sử dụng Cortana". Nhấp vào "Có" hoặc "Không, cảm ơn", tùy thuộc vào việc bạn muốn Trợ lý giọng nói theo dõi dữ liệu của mình (vì vậy nó sẽ học tốt hơn) hay không.

  4. Bây giờ bạn đã bật Cortana, nhấp vào "Windows + S" hoặc nhấp vào bánh răng nằm ở bên trái.
  5. Bật "Này, Cortana" và định cấu hình micro của bạn. Bạn có thể giải quyết trợ lý phản ứng khi ai đó sẽ nói "Này, Cortana" hoặc khiến anh ta chỉ trả lời các đội thoại của bạn.

  6. Thoát khỏi các cài đặt và yêu cầu một cái gì đó trợ lý kỹ thuật số của bạn.

  7. Nhìn vào Internet một danh sách các lệnh và nhiệm vụ có sẵn mà Cortan có thể thực hiện.

Video - Cách bật Microsoft Cortana trong Windows 10

Bộ sưu tập các chương trình của bên thứ ba

Ngoài công cụ nhận dạng giọng nói tích hợp và trợ lý giọng nói Kortan, một số người dùng có thể chuyển sang một thay thế của bên thứ ba. Vì loại chương trình này đang phát triển liên tục, có nhiều sản phẩm khác nhau tương thích với Windows 10 trên thị trường. Câu hỏi duy nhất là nhu cầu và mong muốn của bạn.

Một số chương trình, chẳng hạn như:

  • Lyple Chương trình quản lý giọng nói tuyệt vời trên máy tính, giao diện ngôn ngữ tiếng Nga đơn giản;
  • Rồng từ Nuance của nhà sản xuất, chuyên về chính tả nhanh và nói chung về chuyển đổi lời nói thành văn bản;
  • Tấn công bằng giọng nói, được thiết kế để kiểm soát giọng nói của lối chơi (vâng, bạn có thể khởi động lại vũ khí trong cuộc gọi của nhiệm vụ bằng lệnh thoại);
  • một tiện ích tốt khác là VoxCommando. Thường được sử dụng nhiều nhất trong các chương trình đa phương tiện, chẳng hạn như KODI hoặc iTunes, nhưng cũng có thể hữu ích khi tự động hóa các thiết bị gia đình.

Điều khiển giọng nói máy tính bằng chương trình typle

  1. Tải xuống chương trình và cài đặt trên máy tính, theo các hướng dẫn cài đặt.

  2. Giao diện chương trình đơn giản và dễ hiểu. Khi được chào đón trong cửa sổ chương trình, có những lời khuyên cho người dùng. Để bắt đầu, nhấp vào nút Thêm.

  3. Trong cửa sổ mở ra, nhập tên của bạn vào trường, sau đó nhập lệnh, sau đó nhấp vào nút ghi và nói lệnh thoại. Nhấp vào nút Thêm.

  4. Nhấp vào nút Thêm.

  5. Đánh dấu các mục mong muốn. Chọn chương trình, nhấn nút màu đỏ và nói to ra lệnh này. Sau đó nhấp vào "Thêm".

  6. Bạn sẽ thấy lệnh đã tạo, để kiểm tra, nhấp vào "Bắt đầu nói" và nói lệnh này. Nếu mọi thứ hoạt động theo cùng một cách thêm các lệnh khác.

Hãy thử talktyper.

Đây là một ứng dụng trực tuyến cho phép bạn ra lệnh cho văn bản, sau đó cung cấp một số tùy chọn cơ bản để làm gì với nó. Quạt của chủ nghĩa tối giản sẽ thích nó.


Bạn có thể sao chép clipboard trong clipboard, gửi e-mail, in, tedot và dịch sang ngôn ngữ khác. Để dịch văn bản chỉ cần nhấn nút và chọn ngôn ngữ dịch. Talktyper sẽ tự động mở một tab mới với văn bản được chèn vào Google Translator trong trình duyệt.

Chú ý đến tazti

Tazti nổi bật trong số các chương trình khác với hai tính năng đặc biệt:

  • bạn có thể sử dụng ứng dụng quản lý máy tính và trò chơi bằng các lệnh thoại. Và nếu tazti không có lệnh bạn cần, nó có thể được tạo ra (169 nữa);
  • chương trình có thể chạy các ứng dụng, trang web, thư mục đã cài đặt hoặc sử dụng dòng lệnh.

Cấu hình Tazti theo quyết định của bạn. Nếu bạn không cần một lệnh, sau đó chỉnh sửa hoặc xóa hoàn toàn. Bạn thậm chí có thể thêm các lệnh nhấp và nhấp đúp để thoát khỏi nhu cầu sử dụng chuột.

Tuy nhiên, Tazti có một nhược điểm lớn - nó không có chức năng của chính tả văn bản, vì vậy nó không thể nhận ra giọng nói. Nhà phát triển nhóm Tech Tech công nhận rằng các sản phẩm khác được đối phó tốt hơn nhiều với chính tả, vì vậy công ty đã quyết định tập trung mọi nỗ lực về các đặc điểm khác của trí tuệ của mình.

Tazti được định hướng nhiều hơn đối với các game thủ muốn sử dụng giọng nói của họ để gửi nhân vật đến trận chiến hoặc những người thích chạy chương trình, trình phát phương tiện và xem các trang web mà không cần sử dụng bàn phím. Thực tế là bạn có thể kiểm soát các phần quan trọng của Windows bằng TAZTI khiến nó trở thành một đối thủ xứng đáng của các ứng dụng đã nói ở trên, ngay cả khi nó không cung cấp chính tả.

Quan trọng! Chương trình có thời gian dùng thử 15 ngày. Sau đó, bạn cần phải trả 40 đô la.

Vì vậy, nếu sự công nhận của lời nói hoặc Cortan không đáp ứng yêu cầu của bạn (hoặc bạn chỉ đơn giản là không thể sử dụng chúng), sau đó thử các tiện ích trên.

Video - Đánh giá typle

Khả năng kiểm soát giọng nói trong hệ điều hành Android có mặt trong một thời gian rất dài. Ngay cả trong phiên bản 2.3 Gingerbread (2010), người dùng có thể thực hiện các truy vấn tìm kiếm hoặc bất kỳ hành động chức năng nào bằng giọng nói. Chỉ sau đó nó trông rất kỳ lạ và hoạt động theo cùng một cách. Điều khiển bằng giọng nói Android là gì và các chức năng nào nó có thể cung cấp hàng triệu người dùng? Trả lời tất cả các câu hỏi bạn sẽ tìm thấy trong bài viết này.

Tìm kiếm bằng giọng nói

Tìm kiếm bằng giọng nói là khả năng tìm kiếm thông tin trên Internet bằng các lệnh thoại và không phải các yêu cầu văn bản truyền thống. Nó có thể được sử dụng trên máy tính trong trình duyệt Chrome, cũng như trên điện thoại thông minh và máy tính bảng có Android trong ứng dụng Google. Khởi chạy hệ thống có sẵn theo hai cách - sử dụng lệnh OK Google hoặc bằng cách nhấn logo micrô.

Tìm kiếm bằng giọng nói hiện đại đã trở thành một trong những căn cứ của hệ điều hành Android. Bây giờ nó tương thích với hàng chục sản phẩm và ứng dụng công ty. Google nhấn mạnh vào cơ hội tìm kiếm bất kỳ thông tin nào trên Internet, chỉ bằng cách nói yêu cầu bằng giọng nói mong muốn. Hôm nay, 7 năm sau, tìm kiếm giọng nói cho Google có thể gần như mọi thứ và có thể đáp ứng đầy đủ hệ điều hành người dùng thông thường.

  • Tài liệu tham khảo.
  • Mọi người.
  • Thời gian và lịch.
  • Thời tiết
  • Thị trường và sàn giao dịch chứng khoán.
  • Chuyển đổi và máy tính.
  • Dẫn đường.
  • Cuộc gọi và sms.
  • Từ điển và dịch thuật.
  • Điều khiển.
Các chức năng của mỗi lệnh này chúng ta sẽ tìm kiếm hơn nữa.

tài liệu tham khảo

Google Search cung cấp thông tin tham khảo rộng cho hầu hết mọi loại yêu cầu, dựa trên hệ thống học máy tìm kiếm ngữ nghĩa và hệ thống máy học bassbrain. Thủ đô của đất nước, người tạo ra kiến \u200b\u200btrúc nổi tiếng, tác giả của bức tranh phổ biến, chiều cao của những tòa tháp và núi lớn nhất của thế giới, những người có tầm nhìn của các chuyến bay và bưu kiện, thời gian bình minh và hoàng hôn, độ sâu của những con sông và các hồ, như vậy. Danh sách có thể được tiếp tục trong một thời gian rất dài - trong thực tế nó là tuyệt vời. Tóm lại - nếu bạn cần nhanh chóng học được một cái gì đó hoặc ai đó, thì việc tìm kiếm giọng nói của Google sẽ luôn giải cứu.

Ví dụ:

  1. Thủ đô của Vương quốc Anh.
  2. Chiều cao của tháp Thượng Hải.
  3. Người đã phát minh ra Android.
  4. Chiều dài Titanic.
  5. Walnuts Calorie.

Mọi người

Công cụ tìm kiếm của Google sẽ giúp bạn tìm một người nổi tiếng trên mạng và tất cả các thông tin có sẵn về nó. Dữ liệu chính được lấy từ các nguồn phổ biến - mạng xã hội hoặc trang trong Wikipedia. Người dùng có thể học được nhiều sự kiện về tính cách tìm kiếm: tên thật, nơi và những người làm việc, địa điểm và ngày sinh, sự hiện diện của hôn nhân, cha mẹ là cha mẹ, là những đứa trẻ, đề cử, giáo dục. Ngoài tất cả, ứng dụng cho thấy các yêu cầu liên quan. Họ dựa trên hoạt động của con người và sắp xếp thành các loại: nhạc sĩ, nhà văn, blogger, chủ tịch và như vậy.

Ví dụ:

  1. Cô gái siêu nhân.
  2. Lenin chết.
  3. Người đã giết một tiếng khóc.
  4. Donald Trump bao nhiêu tuổi.
  5. Ai là pavel durov.

Thời gian và lịch

Tìm kiếm của Google được đồng bộ hóa với lịch, vì vậy với yêu cầu chuyên đề có thể đưa ra kết quả liên quan đến các cuộc họp hoặc ghi chú theo kế hoạch. Cũng ngay bên trong ứng dụng với một giọng nói, bạn có thể đặt đồng hồ báo thức, hẹn giờ, thêm một cuộc họp, nhắc nhở bạn về việc mua bánh mì hoặc yêu cầu thức dậy vào ngày mai lúc 9 giờ sáng. Tùy chọn hoạt động theo thời gian và lịch tìm kiếm nhiều - từ các yêu cầu điển hình cho thời gian mặt trời mọc trước khi cài đặt nhắc nhở đầy đủ.

Ví dụ:

  1. Thời gian nào là mặt trời mọc ở Tolyatti.
  2. Múi giờ nào ở New York.
  3. Đánh thức tôi dậy vào ngày mai lúc 11 giờ sáng.
  4. Đặt bộ hẹn giờ trong 5 phút.
  5. Thêm một cuộc họp / nhắc nhở.

Thời tiết

Một trong những yêu cầu được sử dụng thường xuyên nhất trong tìm kiếm bằng giọng nói của Google là thông tin về thời tiết. Ngoài các lệnh tiêu chuẩn để mở dữ liệu thời tiết cho ngày hoặc tuần hiện tại, người dùng có thể học thời tiết ở bất cứ nơi nào trên thế giới - ở thành phố lân cận hoặc trong nước ở đầu kia của hành tinh. Cũng đáng chú ý là tìm kiếm của Google hiểu nhiều yêu cầu khác nhau liên quan đến thời tiết - ví dụ, với thời tiết hoặc liệu nó sẽ mưa hôm nay.

Ví dụ:

  1. Với thời tiết.
  2. Trời sẽ mưa ngày hôm nay.
  3. Thời tiết ở Kiev.
  4. Tốc độ gió.
  5. Ngày mai kết tủa gì.

Thị trường và công ty chứng khoán

Sử dụng tìm kiếm bằng giọng nói, Google có thể ngay lập tức tìm ra chi phí chứng khoán hiện tại hoặc tỷ giá tiền tệ hiện tại. Một số lượng lớn các tập đoàn quốc tế được thể hiện trong hệ thống, có cổ phiếu được cập nhật mỗi giây. Ngoài những người khổng lồ công nghệ của Microsoft, Apple, Google, Samsung, Nokia, LG, Lenovo và những người khác, có những công ty từ các khu vực khác: Gazprom, Sberbank, Yandex, Vimpelcom, Aeroflot và những người khác. Bạn không chỉ xem giá cổ phiếu, mà còn các vectơ phát triển quan trọng khác: vốn hóa thị trường, lợi nhuận hoặc thu nhập cổ tức.

Ví dụ:

  1. Giá cổ phiếu Nokia.
  2. Bao nhiêu là đồng đô la.
  3. Khóa học bitcoin để rúp.
  4. Viết hoa của Sberbank.
  5. Chỉ số Dow Jones.

Chuyển đổi và Máy tính

Công cụ tìm kiếm của Google hỗ trợ các hoạt động toán học khác nhau - bổ sung, phép trừ, nhân, chia, root và lãi. Do đó, bạn không thể không chỉ các tính toán đơn giản nhất mà còn nhận ra rễ và lãi từ các số phức. Cũng ngay bên trong ứng dụng, bạn có thể chuyển đổi tiền tệ - Đếm số lượng rúp bằng đồng đô la, đô la trong rúp, euro trong đồng rúp hoặc đô la bằng euro. Chức năng này thuận tiện cho tốc độ của nó - điều đáng để nói lệnh như thế nào kết quả sẽ xuất hiện trên màn hình trong vài giây. Không cần phải tìm kiếm menu của ứng dụng Máy tính và tự làm mọi thứ, dành theo thời gian.

Ví dụ:

  1. Bao nhiêu trong một centimet một km.
  2. 850 rúp trong tengge.
  3. Căn bậc hai trong số 200.
  4. 10 186 chia cho 4.
  5. 30% 35.000.

dẫn đường

Sử dụng các lệnh thoại thông qua tìm kiếm của Google, bạn hoàn toàn có thể điều hướng địa phương và thậm chí nhiều hơn một. Khóa các tuyến đường từ điểm này sang điểm khác (đi bộ, bằng xe hơi hoặc giao thông công cộng), hiển thị các tổ chức công cộng gần đó, cũng như xem các thành phố và tìm kiếm các điểm tham quan - tất cả điều này có sẵn để tìm kiếm theo lệnh thoại.

Ví dụ:

  1. Bản đồ của Belgorod.
  2. Tuyến đường đến Kremlin (bạn có thể thêm "bằng chân" hoặc "trên xe").
  3. Mongora ở đâu.
  4. Cafe gần đó.
  5. Nhà thuốc gần nhất.

Cuộc gọi và sms.

Sẽ là lạ nếu bạn không thể gọi hoặc gửi tin nhắn văn bản thông qua tìm kiếm bằng giọng nói Google. Đây là một trong những tính năng được sử dụng phổ biến nhất trong điện thoại, vì vậy không thể thực hiện mà không cần truy cập đơn giản cho chúng. Người khổng lồ tìm kiếm hiểu điều này, vì vậy thông qua các lệnh thoại đặc biệt thông qua tìm kiếm của Google, bạn có thể nhanh chóng gọi hoặc viết tin nhắn - không có tay, chỉ có giọng nói. Điều tương tự áp dụng cho các chữ cái điện tử thông qua Gmail. Nó sẽ thuận tiện trong một tình huống khi bàn tay đang bận hoặc sử dụng tai nghe.

Ví dụ:

  1. Gọi chị.
  2. Gọi đến tiệm bánh pizza gần nhất.
  3. Viết Sasha "Tôi đã ở trong văn phòng."
  4. Viết Nastya "Chúng tôi sẽ gặp nhau tại tàu điện ngầm."
  5. Để gửi thư.

Từ điển và dịch thuật

Công cụ tìm kiếm của Google có dịch vụ dịch thuật công ty của công ty. Bạn có thể dịch các từ hoặc toàn bộ cụm từ sang tất cả các ngôn ngữ có sẵn trong Google chỉ bằng cách nói lệnh thoại thích hợp. Ngoài dịch giả, ứng dụng có hỗ trợ từ điển - tìm kiếm các từ và giá trị của chúng chưa bao giờ dễ dàng như vậy.

Ví dụ:

  1. Con người và đặc biệt là gì.
  2. Định nghĩa của thành phần.
  3. Làm thế nào tin tưởng.
  4. Làm thế nào sẽ có một chiếc xe buýt bằng tiếng Tây Ban Nha.
  5. Dịch từ tiếng Nga sang tiếng Thổ Nhĩ Kỳ.

Điều khiển

Ngoài các điểm trên, tìm kiếm bằng giọng nói, Google cho phép bạn kiểm soát các cài đặt riêng lẻ của hệ điều hành và bắt đầu đặt với các ứng dụng đã cài đặt này. Theo mặc định, một số chức năng được hỗ trợ (Wi-Fi, Bluetooth, đèn pin, độ sáng), nhưng trên thực tế chúng là khá đủ. Bạn có thể thay đổi độ sáng màn hình mà không cần chuyển động không cần thiết, bật hoặc tắt Wi-Fi và Bluetooth, kích hoạt đèn pin hoặc thậm chí điều khiển trình phát âm thanh. Tất cả điều này hoạt động, và với sự xuất sắc - nhờ các lệnh thoại được lập trình.

Ví dụ:

  1. Mở trang web.
  2. Mở Instagram (hoặc bất kỳ ứng dụng nào khác).
  3. Phóng to độ sáng.
  4. Hạ khối lượng.
  5. Tạo ảnh / video.
  6. Kích hoạt Wi-Fi.
  7. Tắt đèn pin.
  8. Hiển thị đồng hồ báo thức của tôi.
  9. Kích hoạt Công viên Linkin.
  10. Bài hát tiếp theo (dành cho người chơi).

Truy cập bằng giọng nói.

Android cũng có chức năng cho người khuyết tật. Ngoài việc Talkback (Âm thanh trên màn hình), có một dịch vụ khác có chức năng bổ sung. Nó được gọi là quyền truy cập bằng giọng nói và cho phép bạn kích hoạt quản lý lệnh thoại trên toàn bộ hệ thống. Ứng dụng này là thử nghiệm và được phát hành vào năm 2016. Hiện tại, truy cập bằng giọng nói vẫn đang trong giai đoạn thử nghiệm, nhưng nó không ngăn được trợ lý thực hiện các chức năng của nó.

Truy cập bằng giọng nói dựa trên cùng một công nghệ mà Google sử dụng để tìm kiếm bằng giọng nói. Khi dịch vụ được kích hoạt, mỗi phần tử được gán một số cụ thể trên màn hình. Nó phục vụ như một lệnh để khởi chạy ứng dụng hoặc làm việc với một chức năng cụ thể. Không có tương tác về thể chất là cần thiết - chỉ có giá trị để đặt tên cho số lượng của mặt hàng bạn muốn mở.

Chức năng truy cập thoại này không kết thúc. Ngoài ra, sử dụng ứng dụng này, các lệnh thoại có sẵn trong toàn bộ hệ điều hành. Ví dụ, trong số các lệnh khác được hỗ trợ bởi như "trình duyệt mở", "Chuyển đến trang chủ" hoặc "rụng xuống". Giọng nói được thay thế bằng tất cả - các chức năng cơ bản, điều hướng, cử chỉ (nhấn, cuộn, quay lại hành động) và hoạt động với văn bản (đầu vào, chỉnh sửa, định dạng).

Mặc dù trạng thái beta, ứng dụng truy cập giọng nói sẽ hiển thị điều khiển giọng nói trong Android lên đầu các khả năng. Cùng với tìm kiếm của Google, đây là hai trợ lý giọng nói tốt nhất cung cấp sự tương tác đơn giản hơn với thiết bị.

Ngay cả trước khi phát hành sự phát triển, thử nghiệm và gỡ lỗi giao diện Cortana cho Windows 10, người dùng đã cố gắng sắp xếp điều khiển giọng nói của máy tính. Về cách thức hoạt động như vậy có thể được triển khai trong Windows, được xuất bản lên tới 10-ki và hãy nói chuyện trong bài viết hôm nay.

Cortana.

Cortana - Trợ lý giọng nói với AI, được phát triển bởi Microsoft Corporation cho Windows 10, điện thoại và Android với sự phân phối tiếp theo của dự án trên Xbox và iOS. Nó thay thế chuỗi tìm kiếm cổ điển và thực hiện nhiều hành động, trước hết liên quan đến việc tìm kiếm thông tin và các lệnh hệ thống, nhận chúng từ người dùng dưới dạng lệnh thoại. Tích hợp sâu trong Windows 10, thiếu tiếng Nga (cho đến nay), thu thập thực tế tất cả thông tin người dùng với việc gửi máy chủ của Microsoft và thiếu phiên bản cuối cùng không cho phép hầu hết người dùng quản lý giọng nói đầy đủ của máy tính của riêng bạn.

Ngoài Cortana, có nhiều ứng dụng cho phép bạn quản lý PC thông qua các lệnh của người dùng thoại. Chúng tôi sẽ làm quen với các sản phẩm phổ biến nhất để giải quyết nhiệm vụ này trong Windows 7 và 10.

Typle.

Ứng dụng này chiếm vị trí hàng đầu trong số những người dùng nói tiếng Nga, những người muốn chỉ huy một máy tính thông qua giọng nói. Tiện ích sẽ dễ dàng thay thế một phần quan trọng của các chức năng của Cortana trên Windows 10 và trên "Bảy" sẽ thêm một hàm thường được chứng minh trong phim nơi mọi người quản lý máy tính bằng giọng nói.

Trước khi bắt đầu công việc, hãy tạo một tài khoản và phát minh ra một cụm từ chính bằng cách nghe ứng dụng được kích hoạt. Sau đó, bạn chỉ định một lệnh thoại để quản lý máy tính hoặc thực hiện một hành động cụ thể và khắc phục hoạt động cho nó (bắt đầu ứng dụng, hãy truy cập trang web được chỉ định). Trong cửa sổ chỉnh sửa của các lệnh đã tạo, có thể chỉ định các tham số mà ứng dụng sẽ bắt đầu và chỉ định chế độ khởi động (toàn màn hình, cửa sổ).

Chức năng tiện ích rất hạn chế và giao diện cách xa kiểu Metro được triển khai trong Windows 10. Không thể thực hiện điều khiển giọng nói đầy đủ của PC thông qua Tốc độ: Nó chỉ hỗ trợ mở tệp, ứng dụng (có đối số) và chuyển đổi đến các liên kết được xác định trước. Không có hỗ trợ cho quản lý người chơi (đưa vào tạm dừng, chạy bản nhạc tiếp theo).

LOA

  • tạo ảnh chụp nhanh trạng thái màn hình;
  • chuyển đổi bố cục bàn phím;
  • hoàn thiện Windows 7;
  • khởi chạy một ứng dụng;
  • mở một tập tin.

Quá trình đọc và nhận ra thông tin micrô được khởi động sau khi nhấp vào phím được chỉ định (chọn nút tốt hơn, ít nhất bạn hiếm khi sử dụng để tránh kích hoạt chương trình sai). Để xử lý, nhận dạng giọng nói và thực hiện một nhóm có đủ thời gian - 5 giây trở lên so với bạn phải trả tiền rẻ hơn. Các từ khóa được đưa ra bởi văn bản, và không bằng lời, vì lời nói được công nhận được so sánh với văn bản được giới thiệu, cách xa hoàn hảo. Quản lý người chơi trong ứng dụng bị thiếu.

Gorynych.

Các nhà phát triển của gói phần mềm để điều khiển máy tính với Windows 7 và 10 là nhóm trong nước đầu tiên đã phát hành một ứng dụng để giải quyết loại nhiệm vụ này. Đối với cốt lõi của ứng dụng, Western Dragon Dictate được thực hiện, nơi mô-đun phần mềm trong nước được giới thiệu để nhận ra bài phát biểu của Nga.