Chương trình điều khiển giọng nói. Các chương trình tốt nhất cho máy tính quản lý bằng giọng nói

Khả năng kiểm soát giọng nói trong hệ điều hành Android có mặt trong một thời gian rất dài. Ngay cả trong phiên bản 2.3 Gingerbread (2010), người dùng có thể thực hiện các truy vấn tìm kiếm hoặc bất kỳ hành động chức năng nào bằng giọng nói. Chỉ sau đó nó trông rất kỳ lạ và hoạt động theo cùng một cách. Điều khiển bằng giọng nói Android là gì và các chức năng nào nó có thể cung cấp hàng triệu người dùng? Trả lời tất cả các câu hỏi bạn sẽ tìm thấy trong bài viết này.

Tìm kiếm bằng giọng nói

Tìm kiếm bằng giọng nói là khả năng tìm kiếm thông tin trên Internet bằng các lệnh thoại và không phải các yêu cầu văn bản truyền thống. Nó có thể được sử dụng trên máy tính trong trình duyệt Chrome, cũng như trên điện thoại thông minh và máy tính bảng có Android trong ứng dụng Google. Khởi chạy hệ thống có sẵn theo hai cách - sử dụng lệnh OK Google hoặc bằng cách nhấn logo micrô.

Tìm kiếm bằng giọng nói hiện đại đã trở thành một trong những căn cứ của hệ điều hành Android. Bây giờ nó tương thích với hàng chục sản phẩm và ứng dụng công ty. Google nhấn mạnh vào cơ hội tìm kiếm bất kỳ thông tin nào trên Internet, chỉ bằng cách nói yêu cầu bằng giọng nói mong muốn. Hôm nay, 7 năm sau, tìm kiếm giọng nói cho Google có thể gần như mọi thứ và có thể đáp ứng đầy đủ hệ điều hành người dùng thông thường.

  • Tài liệu tham khảo.
  • Mọi người.
  • Thời gian và lịch.
  • Thời tiết
  • Thị trường và sàn giao dịch chứng khoán.
  • Chuyển đổi và máy tính.
  • Dẫn đường.
  • Cuộc gọi và sms.
  • Từ điển và dịch thuật.
  • Điều khiển.
Các chức năng của mỗi lệnh này chúng ta sẽ tìm kiếm hơn nữa.

tài liệu tham khảo

Google Search cung cấp thông tin tham khảo rộng cho hầu hết mọi loại yêu cầu, dựa trên hệ thống học máy tìm kiếm ngữ nghĩa và hệ thống máy học bassbrain. Thủ đô của đất nước, người tạo ra kiến \u200b\u200btrúc nổi tiếng, tác giả của bức tranh phổ biến, chiều cao của những tòa tháp và núi lớn nhất của thế giới, những người có tầm nhìn của các chuyến bay và bưu kiện, thời gian bình minh và hoàng hôn, độ sâu của những con sông và các hồ, như vậy. Danh sách có thể được tiếp tục trong một thời gian rất dài - trong thực tế nó là tuyệt vời. Tóm lại - nếu bạn cần nhanh chóng học được một cái gì đó hoặc ai đó, thì việc tìm kiếm giọng nói của Google sẽ luôn giải cứu.

Ví dụ:

  1. Thủ đô của Vương quốc Anh.
  2. Chiều cao của tháp Thượng Hải.
  3. Người đã phát minh ra Android.
  4. Chiều dài Titanic.
  5. Walnuts Calorie.

Mọi người

Công cụ tìm kiếm của Google sẽ giúp bạn tìm một người nổi tiếng trên mạng và tất cả các thông tin có sẵn về nó. Dữ liệu chính được lấy từ các nguồn phổ biến - mạng xã hội hoặc trang trong Wikipedia. Người dùng có thể học được nhiều sự kiện về tính cách tìm kiếm: tên thật, nơi và những người làm việc, địa điểm và ngày sinh, sự hiện diện của hôn nhân, cha mẹ là cha mẹ, là những đứa trẻ, đề cử, giáo dục. Ngoài tất cả, ứng dụng cho thấy các yêu cầu liên quan. Họ dựa trên hoạt động của con người và sắp xếp thành các loại: nhạc sĩ, nhà văn, blogger, chủ tịch và như vậy.

Ví dụ:

  1. Cô gái siêu nhân.
  2. Lenin chết.
  3. Người đã giết một tiếng khóc.
  4. Donald Trump bao nhiêu tuổi.
  5. Ai là pavel durov.

Thời gian và lịch

Tìm kiếm của Google được đồng bộ hóa với lịch, vì vậy với yêu cầu chuyên đề có thể đưa ra kết quả liên quan đến các cuộc họp hoặc ghi chú theo kế hoạch. Cũng ngay bên trong ứng dụng với một giọng nói, bạn có thể đặt đồng hồ báo thức, hẹn giờ, thêm một cuộc họp, nhắc nhở bạn về việc mua bánh mì hoặc yêu cầu thức dậy vào ngày mai lúc 9 giờ sáng. Tùy chọn hoạt động theo thời gian và lịch tìm kiếm nhiều - từ các yêu cầu điển hình cho thời gian mặt trời mọc trước khi cài đặt nhắc nhở đầy đủ.

Ví dụ:

  1. Thời gian nào là mặt trời mọc ở Tolyatti.
  2. Múi giờ nào ở New York.
  3. Đánh thức tôi dậy vào ngày mai lúc 11 giờ sáng.
  4. Đặt bộ hẹn giờ trong 5 phút.
  5. Thêm một cuộc họp / nhắc nhở.

Thời tiết

Một trong những yêu cầu được sử dụng thường xuyên nhất trong tìm kiếm bằng giọng nói của Google là thông tin về thời tiết. Ngoài các lệnh tiêu chuẩn để mở dữ liệu thời tiết cho ngày hoặc tuần hiện tại, người dùng có thể học thời tiết ở bất cứ nơi nào trên thế giới - ở thành phố lân cận hoặc trong nước ở đầu kia của hành tinh. Cũng đáng chú ý là tìm kiếm của Google hiểu nhiều yêu cầu khác nhau liên quan đến thời tiết - ví dụ, với thời tiết hoặc liệu nó sẽ mưa hôm nay.

Ví dụ:

  1. Với thời tiết.
  2. Trời sẽ mưa ngày hôm nay.
  3. Thời tiết ở Kiev.
  4. Tốc độ gió.
  5. Ngày mai kết tủa gì.

Thị trường và công ty chứng khoán

Sử dụng tìm kiếm bằng giọng nói, Google có thể ngay lập tức tìm ra chi phí chứng khoán hiện tại hoặc tỷ giá tiền tệ hiện tại. Một số lượng lớn các tập đoàn quốc tế được thể hiện trong hệ thống, có cổ phiếu được cập nhật mỗi giây. Ngoài những người khổng lồ công nghệ của Microsoft, Apple, Google, Samsung, Nokia, LG, Lenovo và những người khác, có những công ty từ các khu vực khác: Gazprom, Sberbank, Yandex, Vimpelcom, Aeroflot và những người khác. Bạn không chỉ xem giá cổ phiếu, mà còn các vectơ phát triển quan trọng khác: vốn hóa thị trường, lợi nhuận hoặc thu nhập cổ tức.

Ví dụ:

  1. Giá cổ phiếu Nokia.
  2. Bao nhiêu là đồng đô la.
  3. Khóa học bitcoin để rúp.
  4. Viết hoa của Sberbank.
  5. Chỉ số Dow Jones.

Chuyển đổi và Máy tính

Công cụ tìm kiếm của Google hỗ trợ các hoạt động toán học khác nhau - bổ sung, phép trừ, nhân, chia, root và lãi. Do đó, bạn không thể không chỉ các tính toán đơn giản nhất mà còn nhận ra rễ và lãi từ các số phức. Cũng ngay bên trong ứng dụng, bạn có thể chuyển đổi tiền tệ - Đếm số lượng rúp bằng đồng đô la, đô la trong rúp, euro trong đồng rúp hoặc đô la bằng euro. Chức năng này thuận tiện cho tốc độ của nó - điều đáng để nói lệnh như thế nào kết quả sẽ xuất hiện trên màn hình trong vài giây. Không cần phải tìm kiếm menu của ứng dụng Máy tính và tự làm mọi thứ, dành theo thời gian.

Ví dụ:

  1. Bao nhiêu trong một centimet một km.
  2. 850 rúp trong tengge.
  3. Căn bậc hai trong số 200.
  4. 10 186 chia cho 4.
  5. 30% 35.000.

dẫn đường

Sử dụng các lệnh thoại thông qua tìm kiếm của Google, bạn hoàn toàn có thể điều hướng địa phương và thậm chí nhiều hơn một. Khóa các tuyến đường từ điểm này sang điểm khác (đi bộ, bằng xe hơi hoặc giao thông công cộng), hiển thị các tổ chức công cộng gần đó, cũng như xem các thành phố và tìm kiếm các điểm tham quan - tất cả điều này có sẵn để tìm kiếm theo lệnh thoại.

Ví dụ:

  1. Bản đồ của Belgorod.
  2. Tuyến đường đến Kremlin (bạn có thể thêm "bằng chân" hoặc "trên máy").
  3. Mongora ở đâu.
  4. Cafe gần đó.
  5. Nhà thuốc gần nhất.

Cuộc gọi và sms.

Sẽ là lạ nếu bạn không thể gọi hoặc gửi tin nhắn văn bản thông qua tìm kiếm bằng giọng nói Google. Đây là một trong những tính năng được sử dụng phổ biến nhất trong điện thoại, vì vậy không thể thực hiện mà không cần truy cập đơn giản cho chúng. Người khổng lồ tìm kiếm hiểu điều này, vì vậy thông qua các lệnh thoại đặc biệt thông qua tìm kiếm của Google, bạn có thể nhanh chóng gọi hoặc viết tin nhắn - không có tay, chỉ có giọng nói. Điều tương tự áp dụng cho các chữ cái điện tử thông qua Gmail. Nó sẽ thuận tiện trong một tình huống khi bàn tay đang bận hoặc sử dụng tai nghe.

Ví dụ:

  1. Gọi chị.
  2. Gọi đến tiệm bánh pizza gần nhất.
  3. Viết Sasha "Tôi đã ở trong văn phòng."
  4. Viết Nastya "Chúng tôi sẽ gặp nhau tại tàu điện ngầm."
  5. Để gửi thư.

Từ điển và dịch thuật

Công cụ tìm kiếm của Google có dịch vụ dịch thuật công ty của công ty. Bạn có thể dịch các từ hoặc toàn bộ cụm từ sang tất cả các ngôn ngữ có sẵn trong Google chỉ bằng cách nói lệnh thoại thích hợp. Ngoài dịch giả, ứng dụng có hỗ trợ từ điển - tìm kiếm các từ và giá trị của chúng chưa bao giờ dễ dàng như vậy.

Ví dụ:

  1. Con người và đặc biệt là gì.
  2. Định nghĩa của thành phần.
  3. Làm thế nào tin tưởng.
  4. Làm thế nào sẽ có một chiếc xe buýt bằng tiếng Tây Ban Nha.
  5. Dịch từ tiếng Nga sang tiếng Thổ Nhĩ Kỳ.

Điều khiển

Ngoài các điểm trên, tìm kiếm bằng giọng nói, Google cho phép bạn kiểm soát các cài đặt riêng lẻ của hệ điều hành và bắt đầu đặt với các ứng dụng đã cài đặt này. Theo mặc định, một số chức năng được hỗ trợ (Wi-Fi, Bluetooth, đèn pin, độ sáng), nhưng trên thực tế chúng là khá đủ. Bạn có thể thay đổi độ sáng màn hình mà không cần chuyển động không cần thiết, bật hoặc tắt Wi-Fi và Bluetooth, kích hoạt đèn pin hoặc thậm chí điều khiển trình phát âm thanh. Tất cả điều này hoạt động, và với sự xuất sắc - nhờ các lệnh thoại được lập trình.

Ví dụ:

  1. Mở trang web.
  2. Mở Instagram (hoặc bất kỳ ứng dụng nào khác).
  3. Phóng to độ sáng.
  4. Hạ khối lượng.
  5. Tạo ảnh / video.
  6. Kích hoạt Wi-Fi.
  7. Tắt đèn pin.
  8. Hiển thị đồng hồ báo thức của tôi.
  9. Kích hoạt Công viên Linkin.
  10. Bài hát tiếp theo (dành cho người chơi).

Truy cập bằng giọng nói.

Android cũng có chức năng cho người khuyết tật. Ngoài việc Talkback (Âm thanh trên màn hình), có một dịch vụ khác có chức năng bổ sung. Nó được gọi là quyền truy cập bằng giọng nói và cho phép bạn kích hoạt quản lý lệnh thoại trên toàn bộ hệ thống. Ứng dụng này là thử nghiệm và được phát hành vào năm 2016. Hiện tại, truy cập bằng giọng nói vẫn đang trong giai đoạn thử nghiệm, nhưng nó không ngăn được trợ lý thực hiện các chức năng của nó.

Truy cập bằng giọng nói dựa trên cùng một công nghệ mà Google sử dụng để tìm kiếm bằng giọng nói. Khi dịch vụ được kích hoạt, mỗi phần tử được gán một số cụ thể trên màn hình. Nó phục vụ như một lệnh để khởi chạy ứng dụng hoặc làm việc với một chức năng cụ thể. Không có tương tác về thể chất là cần thiết - chỉ có giá trị để đặt tên cho số lượng của mặt hàng bạn muốn mở.

Chức năng truy cập thoại này không kết thúc. Ngoài ra, sử dụng ứng dụng này, các lệnh thoại có sẵn trong toàn bộ hệ điều hành. Ví dụ, trong số các lệnh khác được hỗ trợ bởi như "trình duyệt mở", "Chuyển đến trang chủ" hoặc "rụng xuống". Giọng nói được thay thế bằng tất cả - các chức năng cơ bản, điều hướng, cử chỉ (nhấn, cuộn, quay lại hành động) và hoạt động với văn bản (đầu vào, chỉnh sửa, định dạng).

Mặc dù trạng thái beta, ứng dụng truy cập giọng nói sẽ hiển thị điều khiển giọng nói trong Android lên đầu các khả năng. Cùng với tìm kiếm của Google, đây là hai trợ lý giọng nói tốt nhất cung cấp sự tương tác đơn giản hơn với thiết bị.

Nhiều người dùng đã tìm cách làm quen với Trợ lý Cortana trên Windows Phone 8.1 và khả năng của nó. Chương trình xuất hiện vào năm 2014, nhưng trong thời gian này đã thu thập rất nhiều người hâm mộ. Đó là lý do tại sao các nhà phát triển đã thêm nó vào Windows 10, chuyện gì đã xảy ra cách đây không lâu. Nếu chúng ta nói về các chức năng của trợ lý, thì trước hết nên được đề cập về một chức năng tìm kiếm được cải thiện.

Bây giờ tìm kiếm thông tin về một cái gì đó đã trở nên dễ dàng hơn nhiều. Nó là đủ để đưa ra một giọng nói hoặc nhóm viết của Cortan và đợi cho đến khi kết quả sẽ khô. Với nó, cũng có thể theo dõi các tin tức trên thế giới, dự báo thời tiết, gói, vé của nó đến máy bay và phương tiện giao thông khác.

Các chức năng hữu ích bao gồm nhắc nhở các cuộc họp được ghi trong lịch. Cortana Assistant sẽ không cho phép bạn bỏ qua một sự kiện quan trọng và thông báo về nó với tín hiệu âm thanh. Nhân tiện, giờ đây bạn có thể buộc nhắc nhở đến một vị trí nhất định, khá tiện lợi.

Cortana có chức năng giải trí. Ví dụ, cô ấy có thể nói với những câu chuyện cười và những câu chuyện, nói chuyện với người đàn ông, hát những bài hát và nhiều hơn nữa. Các khả năng của nó không ngừng mở rộng, vì vậy bạn chỉ có thể đoán những gì các nhà phát triển cũng sẽ thêm. Cortana Windows 10 sẽ hữu ích cho cả nhà và văn phòng. Một người với cô ấy sẽ giúp tìm thông tin cần thiết dễ dàng hơn, sẽ tăng tốc đáng kể quá trình làm việc.

Thật không may, Cortan trong tiếng Nga vẫn không có sẵn, và không có thông tin về khi bản dịch xuất hiện. Điều quan trọng là phải tính đến rằng có khả năng trợ lý này sẽ không có sẵn ở tất cả các quốc gia. Ở trạng thái, nó sẽ không - các nhà phát triển đã không nói.

Trợ lý của Microsoft được đặc trưng bởi sự dễ quản lý. Bạn có thể sử dụng cả các lệnh thoại và in - tất cả đều phụ thuộc vào mong muốn của người dùng. Cách bật Trợ lý giọng nói của Cortana trong Windows 10, có lẽ là câu hỏi đầu tiên khiến nhiều người quan tâm. Để kích hoạt chương trình, nó đủ để nhấp vào biểu tượng ở dạng O, nằm gần nút "Bắt đầu" hoặc bạn có thể nói "Này, Cortana".

Các lệnh phải được nhập vào trường thấp hơn, trong đó nó được viết "Hỏi một cái gì đó." Đối với đầu vào bằng giọng nói, bạn phải nhấp vào biểu tượng micrô. Kết quả tìm kiếm sẽ được phát hành ngay lập tức. Trang web, chương trình đã cài đặt, ảnh đã tải xuống, bài hát, tài liệu và các tệp khác có thể được hiển thị. Nó là đủ để nhấp vào bất kỳ tập tin nào để kích hoạt nó.

Để Cortana thực hiện các lệnh nghiêm trọng hơn, bạn nên nhấp vào biểu tượng bánh hamburger ở góc trên bên trái. Ở đó bạn có thể thay đổi lời nhắc và tham số điều chỉnh chúng cho chính mình. Đối với bảo vệ, không cần thiết phải lo lắng về nó. Microsoft cung cấp cho người dùng tính bảo mật dữ liệu hoàn chỉnh, điều quan trọng là, vì trợ lý có quyền truy cập vào tất cả các chữ cái để tìm kiếm truy vấn và thông tin cá nhân khác.

Những người không tin tưởng các ứng dụng như vậy có thể định cấu hình chương trình để không thể đọc thư, theo dõi các bưu kiện hoặc xem lịch. Đúng, trong trường hợp này nó được giảm đáng kể.

Ngay khi Cortana xuất hiện bằng tiếng Nga, có thể đánh giá tất cả các khả năng và đổi mới của nó khá nhiều. Khuyến nghị xem kỹ các cài đặt để điều chỉnh chương trình với chính mình và làm cho nó thuận tiện nhất có thể.

Đồng bộ hóa

Người dùng Cortana được cài đặt trên Windows 8.1 được làm quen với khả năng đồng bộ hóa cài đặt và nhắc nhở trên tất cả các thiết bị của họ với tài khoản Microsoft. Điều này được phép sử dụng Trợ lý trên các máy tính bảng, giao tiếp và máy tính khác nhau, đồng thời không điều chỉnh nó cho từng thiết bị riêng biệt.

Một chức năng như vậy đã giúp tiết kiệm thời gian và loại trừ khả năng một người sẽ quên di chuyển vào điện thoại một lời nhắc nhở về cuộc họp, ví dụ, ví dụ, trong một máy tính xách tay. Có thể không phải lo lắng về thực tế rằng một sự kiện quan trọng sẽ bị bỏ lỡ do thực tế là đúng lúc người dùng không thể ở gần máy tính của anh ta.

Trong Cortan, Windows 10 cũng sẽ đồng bộ hóa có thể được điều khiển trực tiếp từ trợ lý hoặc từ bảng mới của tất cả các cài đặt thay thế bảng điều khiển và cài đặt PC. Nó khá tiện lợi, vì không cần thiết phải dành thời gian của bạn để điều chỉnh Cortan trên mỗi thiết bị.

Làm thế nào để vô hiệu hóa chương trình

Nếu nó xảy ra để trợ lý là không cần thiết hoặc có sự lo lắng rằng nó sẽ theo dõi dữ liệu của bạn, thì nó có thể dễ dàng bị vô hiệu hóa. Có hai cách để làm điều này. Đầu tiên là đơn giản nhất - bạn sẽ cần kích hoạt chương trình từ phần tìm kiếm trên thanh tác vụ. Khi hoàn tất, bạn cần mở cài đặt ứng dụng và trong phần "Cortana", thay đổi vị trí của công tắc thành "Tắt".

Cách thứ hai không kém gì dễ dàng. Bạn cũng sẽ cần phải bắt đầu trợ lý và đi đến các cài đặt. Lần này bạn sẽ cần menu "Quyền riêng tư", nói cách khác, "Quyền riêng tư". Bạn nên đi đến mục "Bài phát biểu, Chữ ký và Văn bản", nơi bạn cần nhấp vào "Dừng làm quen với tôi". Đó là tất cả.

Bất kỳ phương thức nào trong số này sẽ tắt hoàn toàn Cortana và xóa tất cả thông tin đã được quản lý để có được chương trình trên thiết bị này. Tuy nhiên, trước khi dữ liệu được thu thập không bị xóa khỏi notepad của nó.

Phần kết luận

Đã, bạn có thể nói chắc chắn rằng Cortana sẽ là một ứng dụng hữu ích mà nhiều chủ sở hữu của hệ điều hành này sẽ được sử dụng. Trợ lý sẽ trở thành một trợ lý xuất sắc cho những người kinh doanh quan trọng để tiết kiệm thời gian của họ và nhận thức được tất cả các sự kiện và các cuộc họp được chỉ định. Điều quan trọng là các nhà phát triển hoạt động tốt so với chương trình và đã loại bỏ tất cả các trục trặc hiện có, nếu có.

Hiện tại, nó vẫn chỉ còn chờ Cortan bằng tiếng Nga. Tất cả người dùng được khuyến nghị để kiên nhẫn, bởi vì trợ lý mới và một số khả năng của nó là sự chú ý. (Tác giả của bài viết là Alexey Troitsky).

Các công nghệ kỹ thuật số đang phát triển nhanh chóng, cung cấp cho chúng tôi các cơ hội mới để tương tác với các thiết bị. Dần dần đạt được sự phổ biến kiểm soát các thiết bị bằng giọng nói. Yandex quyết định theo kịp xu hướng và cung cấp máy tính chạy hệ điều hành Windows.

Ứng dụng được gọi là Yandex.stock và cho phép bạn điều khiển máy tính bằng lệnh thoại, thực hiện các thao tác như tìm kiếm trực tuyến, tìm kiếm tệp và thư mục trên máy tính của bạn, có thể mở các trang web và chạy các chương trình. Bạn thậm chí có thể tắt giọng nói của bạn hoặc khởi động lại máy tính. Về vấn đề này, nó hoạt động nhiều hơn so với tìm kiếm bằng giọng nói của Google và công nghệ tiên tiến hơn của Microsoft trong tên Cortana chỉ hoạt động trong Windows 10 và không có sẵn ở Nga.

Mặc dù ngay lập tức cần lưu ý rằng Yandex.Strock hoạt động chỉ bắt đầu bằng Windows 7 trở lên, tương ứng, Windows 10 cũng được hỗ trợ. Đương nhiên một yêu cầu bắt buộc khác là sự hiện diện của micro trong máy tính. Bạn có thể tải xuống tệp cài đặt Yandex.stocks trên trang bằng cách nhấp vào nút "Set" và lưu nó vào máy tính của tôi, sau đó chạy cài đặt. Có thể lưu ý rằng nó không đề xuất cài đặt phần mềm bổ sung hoặc thay đổi cài đặt trình duyệt. Khi kết thúc quá trình cài đặt, một phần tử mới sẽ xuất hiện trên thanh tác vụ.

Xuất hiện của nó có thể được thay đổi trong cài đặt chương trình, ví dụ, di chuyển sang bên phải của thanh tác vụ vào đồng hồ hoặc thay thế chuỗi vào biểu tượng chương trình.

Sử dụng "Chuỗi Yandex" khá đơn giản, sau khi cài đặt nó ở chế độ chờ. Để kích hoạt nó để chọn từ ba tùy chọn, nhấp vào biểu tượng micrô trong dòng Yandex, nhấp vào kết hợp các phím nóng hoặc phát âm một trong các lệnh sau "Nghe Yandex", "hi yandex" hoặc "ok yandex". Nếu mọi thứ được thực hiện chính xác và hệ thống nhận ra lệnh, sau đó cửa sổ tương ứng sẽ xuất hiện, báo hiệu sự sẵn có của ứng dụng để nhận thêm các lệnh thoại của máy tính.

Bây giờ bạn có thể phát âm lệnh mong muốn. Nếu đây là một cụm từ tùy ý, nó sẽ được hiểu là một yêu cầu tìm kiếm cho Internet và kết quả sẽ được hiển thị trong trình duyệt mặc định bằng công cụ tìm kiếm Yandex. Trong một số trường hợp, câu trả lời được hiển thị ngay trong cửa sổ ứng dụng mà không cần sử dụng trình duyệt.

Tương tự, các lệnh khác đang chạy, với sự khác biệt duy nhất đầu tiên chỉ ra bản chất của lệnh, và sau đó là đối tượng. Nói cách khác, để mở, hãy nói một số loại thư mục trên máy tính trong Explorer, trước tiên bạn phải kích hoạt chuỗi, sau đó phát âm "Mở thư mục tên thư mục".

Dưới đây là một số ví dụ về các đội.

Mở trang web: "Mở" Tiêu đề trang web "» Chạy chương trình: "Chạy" Tên chương trình "» Mở tệp: "Mở" Tên tệp "» Tắt máy tính: "Tắt máy tính"

Theo cùng một cách, bạn có thể gửi máy tính đến chế độ khởi động lại hoặc chế độ ngủ, hãy khởi động các cửa sổ dịch vụ khác nhau, chẳng hạn như "Bảng điều khiển mở". Về khả năng này của chuỗi Yandex không hoàn tất, bạn có thể nhập các lệnh bằng bàn phím, cũng như sử dụng bảng tạm Windows. Đây là chuỗi được gọi là chuỗi tìm kiếm thông minh trong đó các bộ biểu tượng sẽ được cung cấp các tùy chọn phản hồi khác nhau. Đồng thời, trái ngược với dòng tìm kiếm nhân viên trong menu Bắt đầu, Yandex.Strock cung cấp các tùy chọn bổ sung để phản hồi từ tìm kiếm trên Internet.

Ngoài ra, nó có thể được sử dụng làm bảng tắt đến các dịch vụ Yandex hoặc các trang web khác thường được bạn truy cập. Đủ chỉ cần nhấp vào hàng và cửa sổ hiển thị trong hình ảnh ở đầu bài viết.

Vấn đề của tất cả các hệ thống điều khiển bằng giọng nói và Yandex.Strock không vượt quá nhu cầu các lệnh rõ ràng và rõ ràng, nếu không chúng không đúng. Đặc biệt, thậm chí nhận ra cụm từ gần như chính xác, nó thường được chuyển đổi thành truy vấn tìm kiếm thay vì mở một thư mục, bắt đầu một chương trình hoặc mở một trang web cụ thể. Do đó, nó không phải là bất kỳ trang web nào để mở với sự trợ giúp của lệnh thoại, nó hoạt động tốt với các tài nguyên rất phổ biến và nổi tiếng và trong các trường hợp khác, đó là vấn đề.

Một tính năng của tiện ích Yandex.Strock với dữ liệu được lưu trữ trên máy tính là sử dụng dữ liệu Windows Indexing để tìm kiếm chúng. Theo đó, trong trường hợp không có dữ liệu trên một tệp hoặc thư mục trong chỉ mục, sẽ dẫn đến kết quả tìm kiếm không chính xác. Do đó, tại thời điểm nó không thể được gọi là một công cụ chính thức để điều khiển máy tính bằng giọng nói, mặc dù tiếng Nga nhận ra khá tốt và với một số chức năng mà nó hoàn toàn sao chép.

Một tính năng khác của hệ thống điều khiển giọng nói của máy tính có thể khiến một số người dùng đang nghe liên tục đến chương trình không gian bên cạnh máy tính để dự đoán lệnh để kích hoạt. Theo đó, ghi âm trái phép tất cả các cuộc hội thoại người dùng và gửi chúng đến một máy chủ từ xa về mặt lý thuyết. Tất nhiên, đây đã lắng nghe bất hợp pháp, nhưng về mặt lý thuyết có thể.

Nếu bạn bỏ hoàn toàn hoang tưởng, bạn có thể nhớ rằng một số nhà phát triển phần mềm quản lý giọng nói đã được phép gửi đến máy chủ đã nhập các cụm từ thoại của người dùng để cải thiện các thuật toán nhận dạng giọng nói hơn nữa. Làm thế nào để đối xử với nó và nó đáng để sử dụng điều khiển giọng nói trên máy tính, mỗi người tự quyết định.

beginpc.ru.

Cách cấu hình máy tính điều khiển bằng giọng nói

Có một số lý do mà người dùng không thể kiểm soát máy tính bằng phương tiện thông thường - bàn phím và chuột. Đầu tiên, nó có thể được liên kết với một sự cố của các thiết bị này. Thứ hai, một sự cần thiết như vậy phát sinh ở những người khuyết tật. Và cuối cùng, thứ ba, người dùng chỉ đơn giản muốn bằng cách nào đó tạo điều kiện thuận lợi cho nhiệm vụ làm việc với máy tính, đưa cho anh ta các đội cho anh ta.

Windows có ứng dụng nhận dạng giọng nói thông thường, nhưng thật không may, nó không hỗ trợ tiếng Nga, nhưng chỉ - tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Nhật và tiếng Trung.

Nếu giao diện phân phối Windows của bạn được thiết kế cho các nhà mạng của một trong các ngôn ngữ trên và tất nhiên, bạn nói, sau đó bạn có thể sử dụng chương trình nhận dạng giọng nói thông thường. Để thực hiện việc này, bạn cần thực hiện 3 bước: Thiết lập micrô, vượt qua một khóa đào tạo đơn giản về quản lý máy tính bằng giọng nói (nó cũng được bao gồm trong Windows) và định cấu hình chương trình nhận dạng giọng nói.

Để làm điều này, cần thiết (mô tả của các phần HĐH sẽ được thực hiện bằng tiếng Nga):


Và những gì cần biết người dùng Windows nói tiếng Nga? May mắn thay, có một lối thoát - sử dụng các chương trình của bên thứ ba. Có nhiều ứng dụng tương tự - cả thanh toán và miễn phí. Trong số tất cả các ứng dụng để kiểm soát giọng nói của máy tính có hệ thống Windows, Lyple được tô sáng đặc biệt. Về cô ấy và sẽ được thảo luận.

Quản lý máy tính bằng cách sử dụng typle

Theo hầu hết người dùng thích quản lý máy tính bằng giọng nói, chương trình typle là một trong những người giỏi nhất (nếu không phải là tốt nhất).

Ứng dụng nhỏ này có khả năng không chỉ để thực hiện các lệnh có sẵn trong cơ sở dữ liệu của nó, mà còn hỗ trợ tạo tùy chỉnh. Đó là cái sau được đặc biệt có giá trị trong ứng dụng này.

Chương trình được phân phối miễn phí, nhưng trong phiên bản miễn phí, có những hạn chế về việc tạo các lệnh tùy chỉnh. Tuy nhiên, những tính năng này là khá đủ cho một người dùng thông thường.

Vì vậy, tải về và cài đặt chương trình. Khi bạn khởi động lần đầu tiên, ứng dụng sẽ yêu cầu bạn nhập một số dữ liệu cá nhân - bạn có thể chỉ định bất kỳ ký tự nào trong các trường này. Sau đó, bạn phải chọn một giấy phép - chọn tùy chọn đầu tiên từ 3 đề xuất (cho đến khi tất cả các dòng chữ bằng tiếng Anh) và nhấp vào Tiếp theo.

Sau khi ứng dụng cung cấp thông tin bạn cần làm việc, bạn sẽ thấy cửa sổ khởi động với các lời nhắc:

Typle sẽ yêu cầu bạn nhấp vào nút Thêm. Sau khi nhấp, bạn cần nhập tên của mình (nhập bất kỳ) - nó là cần thiết để ứng dụng có thể thực thi chính xác các lệnh của bạn trong trường hợp bạn không phải là người dùng duy nhất của máy tính. Cũng điền vào trường "Nhập từ khóa" (bạn có thể để lại tùy chọn được đề xuất "Mở"). Chính từ này sẽ được sử dụng để chạy các nhóm của bạn, hoặc đúng hơn, cụm từ này sẽ cung cấp cho chương trình để thực hiện lệnh mà bạn sẽ được phát âm.

Nó vẫn còn để nhấp vào nút Bản ghi, sau đó nói bất kỳ cụm từ nào (độ dài ghi phải ngắn hơn 1,5 giây). Để kiểm tra, bạn có thể nói "Mở". Sau khi hồ sơ thành công, typle sẽ hỏi bạn về việc lưu lệnh đã ghi.

Tiếp theo, nhấp vào nút "Thêm" trong menu trên cùng. Một cửa sổ sẽ mở trong đó bạn cần chọn một chương trình để khởi động nó sau khi phát âm từ khóa đến micrô. Ví dụ: chọn ứng dụng Opera 35 (bạn có thể chọn bất kỳ chương trình nào của mình - trình duyệt, người chơi hoặc một số loại Messenger loại Skype).

Hãy chú ý đến dưới cùng của cửa sổ. Hiện tại, đánh dấu được đặt ở mục "Chương trình và tệp". Bạn cũng có thể duy nhất các mục khác. Ví dụ: cài đặt một đánh dấu vào các tệp Windows. Bây giờ trong cửa sổ Lựa chọn Lệnh, Chương trình Windows tiêu chuẩn (Notepad, Paint, Dòng lệnh, v.v.), cũng như các ứng dụng hệ thống khác nhau, chẳng hạn như Trung tâm cập nhật hoặc Master Defragmentation và các ứng dụng khác được hiển thị. Đây là một tính năng thuận tiện cho người dùng thường phải đối mặt với cấu hình của hệ thống máy tính.

Một khả năng thú vị khác của typle là khả năng mở các trang web Internet đã chọn. Để thực hiện việc này, hãy cài đặt một đánh dấu vào các mục yêu thích trên Internet và chọn trang web mong muốn từ danh sách.

Một khi bạn đã chọn một hành động phù hợp, bạn sẽ cần phải viết một lệnh để thực thi nó. Để thực hiện việc này, nhấp vào biểu tượng Ghi bên cạnh trường trong đó tên của hành động đã chọn (chương trình, trang web và tương tự) được viết và sau đó phát âm bất kỳ cụm từ nào. Trong trường hợp của chúng tôi, đây là "Opera".

Sau khi lưu thành công bản ghi, bạn có thể xác minh chính xác thực thi lệnh bằng chương trình typle. Để làm điều này, bạn cần nói từ "mở" vào micrô, và sau đó ngay lập tức cụm từ được bạn ghi vào bước cuối cùng để chạy một chương trình nhất định. Trong trường hợp của chúng tôi, lệnh nghe có vẻ giống như Open Open Opera. Sau những từ này, chương trình sẽ tự động khởi chạy trình duyệt.

Như bạn có thể thấy, quản lý chương trình typle để quản lý chương trình typle không quá khó. Bạn có thể tạo nhiều lệnh khác nhau, khi bạn nói những lệnh này hoặc các ứng dụng khác sẽ được kích hoạt, tài liệu tài liệu hoặc bắt đầu phát video hoặc nhạc.

Video về chủ đề - Chương trình VoxCommando

Tốt công khai:

Ustanovkaos.ru.

Typle - máy tính điều khiển bằng giọng nói

Hôm nay chúng ta sẽ nói về bài phát biểu của chúng tôi. Tôi muốn quản lý giọng nói máy tính của mình, mà không có sự giúp đỡ của đầu ngón tay của bạn? Và, như họ nói, - sức mạnh của suy nghĩ! Đúng, chúng tôi sẽ không quản lý máy tính theo sức mạnh của suy nghĩ, nhưng điều này rất thực tế.

Chương trình typle là một trong những chương trình Windows tốt nhất để quản lý máy tính thông qua giọng nói. Trên các trang web trong các ý kiến \u200b\u200bcho chương trình này, các ý kiến \u200b\u200bhội tụ.

Đúng là thiếu sót của bạn. Nhưng nhiều hơn về điều này sau. Nhân tiện, nếu bạn quan tâm đến việc gõ bằng giọng nói - hãy đọc đánh giá của tôi.

Bạn có thể tải xuống chương trình tại đây: http://freesoft.ru/typle

Làm thế nào để sử dụng nó? Lúc đầu, khởi chạy nó và xem các nút điều khiển chính:

Chương trình chào đón chúng tôi và ngay lập tức cho chúng tôi lời nhắc cách sử dụng typle. Ở đầu, nhấp vào nút "Thêm" và viết một từ, chẳng hạn như "Mở". Để làm điều này, hãy nói từ này vào micro:

Sau đó bấm Thêm. Vì vậy, chúng tôi đã lưu từ "Mở" trong chương trình. Bạn có thể nói trong micro bất kỳ từ nào khác. Điều chính là không nhầm lẫn.

Bước tiếp theo sẽ được thêm lệnh. Để làm điều này, hãy đi đến thời điểm này:

Sau đó, chúng tôi đặt một đánh dấu đối diện với mục mà chúng ta cần:

Chọn chương trình, ứng dụng hoặc hành động và nhấp vào nút Bản ghi màu đỏ. Nếu máy tính nhận thấy giọng nói của chúng ta, hãy nhấp vào "Thêm":

Và bây giờ một nhóm giọng nói sẽ được nhìn thấy trong hồ sơ của chúng tôi. Trong trường hợp này, một trong những mở 7-zip:

Và bây giờ bằng cách nhấp vào nút cuối cùng "Bắt đầu nói chuyện"

chúng tôi nói về cụm từ "Mở Sevena Zip". Trong trường hợp của tôi, mọi thứ sẽ hoạt động. Và chương trình 7-ZIP sẽ mở. Nhớ một cụm từ như vậy: Sim Sim mở? Đây là một cái gì đó xấp xỉ như nhau.

Chương trình không phải lúc nào cũng hoạt động đầy đủ. Bây giờ ngôn ngữ Nga hùng mạnh không được nghiên cứu đầy đủ bởi các lập trình viên ngôn ngữ ... nhưng vẫn tốt khi máy tính đang lắng nghe bạn.

Do đó, để thử nghiệm và tò mò, chương trình typle sẽ phù hợp 100%.

Trong video này, bạn có thể thấy lịch sử tạo ra các công cụ thoại đầu tiên và chúng ta nên làm việc gì khác:

Có những tên khủng khiếp như vậy của các chất tương tự khác của chương trình, như Gorynych, Perpetuum, Distograph, Chỉ huy giọng nói. Nhưng tất cả bọn họ là "không như vậy." Đừng chỉ trích một chương trình đàng hoàng.

P.S. Tôi đã đi trong 5 phút để làm chủ chương trình này. Đây là thời gian khá dài (chủ yếu trong các chương trình như vậy tôi hiểu 1-2 phút). Nếu câu hỏi phát sinh - viết. Cho đến khi gặp nhau, bạn bè :)!

Bạn có thích bài viết? Nhấp vào bất kỳ nút nào:

teweb.ru.

Điều khiển giọng nói máy tính - Máy tính không có bàn tay

Theo nhiều yêu cầu của khách truy cập vào trang web này: Chúng tôi giới thiệu cho bạn câu trả lời cho câu hỏi: Làm thế nào để quản lý giọng nói máy tính. Hoặc máy tính điều khiển bằng giọng nói. Trong tiếng Nga tất nhiên. Lạ, nhưng điều khiển giọng nói của máy tính, Windows không phổ biến trên mạng và trong các lập trình viên. Không có nhiều chương trình thú vị như vậy để quản lý giọng nói. Hơn nhiều tiền hơn nếu chúng ta nói về quản lý giọng nói bằng tiếng Nga.

Nhưng đây là nhu cầu. Ví dụ: chú ý đến các bình luận ở bên trái): "Make As Whe Iron Khi anh ta nói chuyện với máy tính mọi lúc để nó thực thi lệnh để mở các thư mục và chương trình." Đây là một nhận xét - yêu cầu của khách truy cập của trang web của tôi.

Vâng, tất nhiên, ngay tại đây chúng tôi sẽ không làm, nhưng chúng tôi sẽ giúp đỡ với một cái gì đó. Lưu ý, chúng tôi không nói đơn giản về các chương trình phát thanh phát biểu hoặc thậm chí về chương trình giọng nói giọng nói tiếng Nga (nó nằm trong bài viết của chúng tôi "Cách nói chuyện với máy tính." Hôm nay là một bài viết về quản lý, hệ thống quản lý. Máy tính điều khiển giọng nói.

Đó là bạn có thể đưa ra các lệnh cho máy tính - và nó được thực hiện. Chúng tôi trình bày các chương trình quản lý máy tính thú vị cho thử nghiệm của bạn.


1. typle - máy tính điều khiển bằng giọng nói. Theo kết quả kiểm tra - Prog là siêu. Nhận dạng giọng nói ở mức cao (thậm chí thông qua micrô thông thường được tích hợp vào buồng web). Đây là chương trình điều khiển giọng nói hợp lệ bằng tiếng Nga. Giao diện rất rõ ràng và đơn giản. Chương trình rất thú vị và cần thiết. Tải về typle miễn phí ngay tại đây.2. Loa - Chà, một chương trình rất thú vị về quản lý giọng nói và sự sơ tán của bài phát biểu của Nga. Nó hoạt động đơn giản và nhanh chóng. Điều duy nhất bạn cần là một kết nối internet. Đây là một loại ứng dụng nhiều mây. Nhưng mọi thứ đều hoạt động. Cảm ơn các nhà phát triển. Dưới đây là trang web của họ: http: // Golos Control. FLF Tải xuống miễn phí Ứng dụng quản lý máy tính luôn ở đây.

Vì vậy, nếu bạn muốn điều khiển máy tính mà không cần chuột và bàn phím, quản lý các chương trình máy tính và giọng nói, I.E. Để sử dụng điều khiển bằng giọng nói: hãy thử những chương trình thú vị này. Để thuận tiện cho bạn, chúng tôi đã thu thập tất cả ba chương trình trong một kho lưu trữ. Ngoài ra còn có một Microsoft .NET Framework 4, người cần tải xuống miễn phí tại đây. Hoặc ở đây. Tất cả mọi thứ là bằng tiếng Nga, mọi thứ đều miễn phí và không cần đăng ký.

trang web.google.com.

Kiểm soát giọng nói và cử chỉ trên máy tính

Những gì anh chàng không mơ ước lái máy tính bằng ghế sofa giữa các cử chỉ và các đội thoại? Thật kỳ lạ, nhưng nó đã có thể. Và trong tương lai gần, mỗi giây sẽ vẫy tay trước màn hình. Bài báo thảo luận về một số cách và triển vọng ngay lập tức.

Kiểm soát giọng nói trên Windows

Hãy bắt đầu với phần mềm miễn phí cho phép bạn kiểm soát máy tính với sự trợ giúp của bài phát biểu tiếng Nga. Bạn có thể thuyết phục nó để mở các chương trình, thực hiện một số hành động, v.v. Và bàn tay của bạn sẽ miễn phí cho những điều quan trọng hơn.

Typle.

Chương trình này là người lãnh đạo trong các chương trình cho phép bạn chỉ huy một máy tính trong tiếng Nga bản địa của chúng tôi. Sau khi cài đặt, bạn sẽ cần phải có người dùng và đưa ra một từ khóa như "OK, Windows", mặc dù chúng tôi được thông báo bằng từ "Mở". Đó là từ anh ấy rằng chúng tôi bắt đầu nói, một triển khai quen thuộc trong Google Glass tồn tại.

Sau đó, bạn chọn đội. Bạn chỉ có thể thêm sự khởi chạy của bất kỳ chương trình nào và khi bạn nhấn Ngoài ra hãy chọn chương trình và thêm bất kỳ đối số nào. Có thể nếu bạn thêm một cái gì đó vào đầu chương trình, sau đó sẽ có hành động. Nhưng nói chung, người dùng thông thường để quản lý máy tính sẽ không hoạt động hoàn toàn, không có tạm dừng hoặc bản nhạc tiếp theo, chỉ cần chạy và chạy.

Bạn có thể tải xuống chương trình từ trang web chính thức miễn phí. Hoặc mua một phiên bản trả phí với giá 13 đô la, nếu bạn cần viết nhiều hơn 450 đội, mặc dù nó là không thể.

Có ít nhất 5 chương trình như vậy với khả năng kiểm soát giọng nói trên máy tính, nhưng tất cả chúng đều kém hơn so với typle. Trên một số bạn có thể nghe, ví dụ, sự phát triển của Nga của Gorynych, trên thực tế nó rất yếu hoặc không nhận ra tất cả. Tôi thậm chí còn tìm cách tìm một số loại tương tự Siri cho một máy tính đã tạo một người và được gọi là điều khiển bằng giọng nói tiếng Nga.

LOA

Có ít phổ biến, nhưng một cái gì đó tốt hơn. Một trong những người nói này Nó không chỉ cho phép bạn chạy các ứng dụng và tệp, mà còn thực thi một số lệnh, chẳng hạn như thay đổi bố cục bàn phím, tạo ảnh chụp màn hình và thậm chí tắt máy tính. Tôi không khuyên sau để sử dụng mà không có cơ hội. Vẫn còn ít lệnh và bạn sẽ không thêm của riêng mình và một lần nữa, không có người chơi điều khiển.

Tôi sẽ lưu ý ở đây cách mọi thứ hoạt động. Bạn cần sử dụng nút chuột giữa hoặc Ctrl trên bàn phím để bắt đầu xử lý giọng nói. Các khóa phổ biến khá phổ biến được các chương trình khác sử dụng, để sẽ có thời gian để thoát khỏi cửa sổ "Không thể nhận ra giọng nói :("

Tôi đã nhấp vào nút, cho biết từ "liên hệ" cho biết, bản ghi được gửi đến máy chủ, sau đó trả về văn bản kết quả và hành động được thực hiện - Chuyển đến trang VKontakte. Tất cả điều này là 5-10 giây, phải mất, không hoàn toàn tốc độ, nhưng đối với các lập trình viên kém, kết quả không phải là xấu. Theo như bạn hiểu, bạn cần một kết nối internet vĩnh viễn, nhưng bây giờ nó không còn là vấn đề nữa.

Các lệnh được xác định bởi văn bản, không phải là một bản ghi trái ngược với typle. Và sau đó văn bản được công nhận đã được so sánh với các lệnh. Nhận dạng là tuyệt vời với độ chính xác với chữ cái, nhưng bản thân màn phóng không quá thoải mái.

Trong thực tế, tôi không sử dụng điều khiển bằng giọng nói, vì micrô phải luôn ở gần. Tôi, mặc dù có một micro đã mua, nhưng ở khoảng cách 1 mét, anh ta không nghe thấy tôi. Vâng, và khi tôi nói, nó cũng không thể làm việc lần đầu tiên. Với kiểm soát cử chỉ, mọi thứ thú vị hơn nhiều.

Bạn có thể tải về từ đây.

Quản lý cử chỉ trên máy tính

Kể từ khi xuất hiện máy ảnh Playstation®Eye và Kinect, mọi người muốn các tính năng tương tự trên máy tính. Sau đó, Kinect thậm chí đã bắt đầu bán các nhà phát triển, nhưng đối với người dùng tổng thể, một sản phẩm như vậy không được công bố. Và thậm chí có tin tức rằng Kinect 2.0 với Xbox One sẽ không hoạt động trên máy tính, nhưng phiên bản đặc biệt của Kinect sẽ được phát hành và cho PC. Đúng, không có phần mềm thích hợp, có rất ít lợi ích từ nó. Vì vậy, chuyển sang chính phần mềm.

Chớp cánh.

Cách phổ biến nhất và giá cả phải chăng để kiểm soát cử chỉ là chương trình rung động và sự mở rộng Chrome tương ứng. Đối với chương trình này, hầu hết mọi webcam sẽ phù hợp.

Khá ít chức năng, nhưng chúng hoạt động rất tốt. Chúng ta có thể tạm dừng và tiếp tục hiển thị Palm. Chuyển dấu hoặc video sang trái hoặc phải, tùy thuộc vào nơi chúng tôi chỉ ngón tay. Chương trình hoạt động trong PowerPoint, VLC, Winamp, iTunes, YouTube và một số dịch vụ khác mà ít người sử dụng.

Các chuyên gia cho rằng một trong những ý tưởng hay nhất về các nhà phát triển Windows 10 đã được thêm vào hệ thống trợ lý giọng nói Cortana. Các trợ lý như vậy đã được sử dụng từ lâu của các chủ sở hữu điện thoại di động, nhưng việc bổ sung một dịch vụ như vậy cho máy tính đã xảy ra lần đầu tiên trong Windows 10. Cortana vẫn chỉ được giao tiếp bằng tiếng Anh, tiếng Trung và nhiều ngôn ngữ nữa mà Nga, không may, không áp dụng. Thật thú vị, theo mặc định, ngay cả Cortana nói tiếng Anh cũng không có sẵn cho cư dân của Nga và các quốc gia CIS khác, nhưng nó có thể được sửa chữa bằng cách thay đổi một số cài đặt hệ điều hành.

Cortana có thể gì

Vì vậy, Cortana là một trợ lý giọng nói ảo sẽ giúp bạn dễ dàng ghi chú, hãy thêm một lời nhắc cho bạn, học thời gian biểu của các chuyến tàu hoặc vận chuyển khác và sẽ cung cấp cho bạn thông tin bạn cần, nó cũng có thể hỗ trợ một cuộc trò chuyện với bạn, Nói với những câu chuyện cười, hát những bài hát và nhiều hơn nữa.

Lần đầu tiên cô xuất hiện với thế giới vào năm 2014, và từ lúc nó được sử dụng đầu tiên trên Windows Mobile 8.1, và bây giờ nó đã trở thành một tính năng đặc biệt của Windows 10.

Trong Windows 10, nó thay thế công cụ tìm kiếm tiêu chuẩn và có thể tìm kiếm thông tin trên cả Internet và đĩa cứng. Sử dụng điều khiển bằng giọng nói Cortana, ngoài việc tìm kiếm thông tin, có thể chạy các chương trình, thực thi các thao tác trên các tệp và thậm chí thay đổi cài đặt hệ thống.

Cortana làm việc ở đâu?

Thật không may, hôm nay, không phải ai cũng có thể sử dụng chương trình này như một trợ lý cá nhân. Trong khi cô học cách hiểu và chỉ nói sáu ngôn ngữ:

  • tiếng Anh;
  • tiếng Đức;
  • người Trung Quốc;
  • người Ý;
  • người Tây Ban Nha;
  • người Pháp.

Theo đó, nó chỉ hoạt động ở những quốc gia đó, nơi một trong những ngôn ngữ này được sử dụng làm một ngôn ngữ chính. Theo thời gian, các nhà phát triển hứa rằng người trợ giúp giọng nói này sẽ có mặt ở tất cả các quốc gia. Nhưng, nếu bạn không muốn chờ đợi, hãy tìm ra cách bật Cortana trên Windows 10 ở các khu vực khác.

Cách bật Cortana trên Windows 10 ở Nga

Chính trợ lý và cài đặt của nó được đặt trong hộp tìm kiếm nằm bên cạnh menu "Bắt đầu". Nhưng trong khu vực của chúng tôi, chúng tôi sẽ chỉ thấy một thông điệp mà Cortana không có sẵn cho chúng tôi.

Điều này là do ngôn ngữ giao diện Windows không khớp với loại hỗ trợ chương trình này.

Vì vậy, hãy làm theo các bước sau để bao gồm một trợ lý có thể giao tiếp với bạn bằng tiếng Anh:


Khi bạn theo dõi các bước, bạn có thể sử dụng Cortan một cách an toàn, vì việc sử dụng nó là miễn phí.

Thông thường, người dùng phàn nàn về công việc tồi tệ của chương trình, tranh luận rằng nó không phải lúc nào cũng hoàn thành hướng dẫn của họ. Và điểm ở đây không phải là công việc sai của trợ lý, nhưng chương trình đã được cấu hình cho người dùng nói tiếng Anh, và do đó hiểu rõ về bài phát biểu của họ, nhưng nó không thể hiểu được giọng nói tiếng Anh của bạn. Vì lý do này, những vấn đề như vậy phát sinh.

Bạn có thể xem trực quan video, cách bật Trợ lý giọng nói của Cortana trên máy tính của bạn.

Kích hoạt Cortana trên điện thoại

Giống như trên máy tính, Cortana trên điện thoại hỗ trợ cùng sáu ngôn ngữ như trên máy tính. Nhưng, những hạn chế này không làm giảm sự quan tâm đến nó trong nói tiếng Nga và các quốc gia khác. Nhưng, có thể kết nối Cortana trên Windows 10 Mobile nếu bạn sống ở Nga không? Có, đối với điều này, nó sẽ đủ để thay đổi các cài đặt sau:

  • vùng cư trú (Hoa Kỳ);
  • ngôn ngữ giao diện (tiếng Anh);
  • tắt dịch vụ định vị địa lý (trong một thời gian trước khi khởi động lại điện thoại).

Sau khi khởi động lại, bạn sẽ có cơ hội làm việc với Cortana, như với một trợ lý giọng nói cá nhân.

Đầu ra

Điều quan trọng cần nhớ là bằng cách tiến hành các hành động bao gồm Cortana, nó sẽ hoạt động, chỉ có tại một trong những ngôn ngữ được hỗ trợ. Nếu bạn không biết một trong những ngôn ngữ này, hoặc cách phát âm của bạn sẽ khiến nhiều thứ mong muốn, bạn sẽ thuận tiện hơn khi từ chối ý tưởng sử dụng Cortana như một trợ lý cá nhân.

Một số chuyên gia cho rằng Microsoft sẽ sớm phát hành một phiên bản tiếng Nga của chương trình này, tranh luận rằng trong cài đặt Windows 10, trong phần Tính năng bổ sung đã có gói dữ liệu nói tiếng Nga.

Những người khác dẫn đến họ như một ví dụ về Kinect, trong vài năm sau đó, đã không đạt được tiếng Nga hoặc Siri trong căn cứ của họ, học cách nói tiếng Nga chỉ năm sau khi bắt đầu phiên bản tiếng Anh. Chúng ta chỉ cần theo dõi tin tức từ Microsoft.

Một người chuyển sang tôi với yêu cầu viết một chương trình cho phép bạn quản lý chuột máy tính bằng giọng nói. Sau đó, tôi không thể tưởng tượng được rằng, gần như một người bị liệt hoàn toàn, thậm chí không thể quay đầu, nhưng anh ta chỉ có thể nói chuyện, có thể phát triển một hoạt động nhanh chóng, giúp đỡ mình và những người khác sống cuộc sống năng động, nhận được kiến \u200b\u200bthức và kỹ năng mới, công việc và kiếm tiền , Giao tiếp với những người khác trên toàn thế giới, tham gia vào sự cạnh tranh của các dự án xã hội.

Hãy để tôi mang đến đây một vài liên kết đến các trang web, tác giả và / hoặc cảm hứng về ý thức hệ mà người này là Alexander Makarchuk từ Borisov, Belarus:

Để làm việc trên máy tính, Alexander đã sử dụng chương trình điều khiển giọng hát - Sự phát triển của sinh viên Đại học Washington, được sản xuất trên Quỹ Khoa học Quốc gia Quốc gia (NSF). Xem melodi.ee.washington.edu/vj.

Tôi không thể cưỡng lại

Nhân tiện, trên trang web của trường đại học (http://www.washington.edu/) 90% bài viết về tiền bạc. Thật khó để tìm thấy bất cứ điều gì về công việc khoa học. Ví dụ, các đoạn trích từ trang đầu tiên: "Tom, tốt nghiệp đại học, được sử dụng để ăn nấm và hầu như không được trả tiền cho căn hộ. Bây giờ anh ta là một người quản lý công ty CNTT cao cấp và tín dụng đại học "", "Dữ liệu lớn giúp đỡ những người vô gia cư", công ty đã cam kết trả 5 triệu đô la cho một tòa nhà giáo dục mới. "

Có phải đó là một con mắt duy nhất cắt cho tôi?


Chương trình được thực hiện vào năm 2005-2009 và hoạt động tốt trên Windows XP. Trong các phiên bản Windows gần đây hơn, chương trình có thể đi chơi không thể chấp nhận được đối với một người không thể rời khỏi ghế và khởi động lại nó. Do đó, chương trình là cần thiết để làm lại.

Không có văn bản nguồn, chỉ có các ấn phẩm riêng biệt mà các công nghệ mở trên đó dựa trên (MFCC, MLP được đọc về nó trong phần thứ hai).

Trong hình ảnh và sự tương đồng đã được viết một chương trình mới (trong ba tháng).

Trên thực tế, hãy xem nó hoạt động như thế nào, bạn có thể:

Tải xuống chương trình và / hoặc xem mã nguồn có thể được.

Bạn không cần bất kỳ bước đặc biệt nào để cài đặt chương trình, chỉ cần nhấp vào nó, nhưng chạy. Người duy nhất, trong một số trường hợp, cần phải thay mặt quản trị viên (ví dụ: khi làm việc với bàn phím ảo "COMFORY KYS PRO"):

Có lẽ đáng được đề cập ở đây và về những thứ khác mà trước đây tôi đã làm để bạn có thể quản lý máy tính mà không có tay.

Nếu bạn có cơ hội quay đầu, thì một sự thay thế tốt cho eviacam có thể phục vụ như một con quay hồi chuyển được buộc chặt vào đầu. Bạn sẽ nhận được định vị con trỏ nhanh và chính xác và độc lập ánh sáng.

Nếu bạn chỉ có thể di chuyển học sinh mắt, bạn có thể sử dụng trình theo dõi xem và chương trình cho nó (có thể gặp khó khăn nếu bạn đeo kính).

Phần II. Làm thế nào nó hoạt động?

Từ các tài liệu được công bố về chương trình "Bộ điều khiển giọng hát" Người ta biết rằng nó hoạt động như sau:
  1. Cắt một luồng âm thanh trên các khung hình của 25 mili giây với một vòng xoắn trong 10 mili giây
  2. Bắt 13 Fatiff Kepstal (MFCC) cho mỗi khung
  3. Kiểm tra những gì được phát âm là một trong 6 âm thanh ghi nhớ (4 nguyên âm và 2 phụ âm) với sự trợ giúp của PercePtron nhiều lớp (MLP)
  4. Hiện trạng của âm thanh được tìm thấy trong chuột chuyển động / nhấp chuột
Nhiệm vụ đầu tiên chỉ đáng chú ý bởi thực tế là đối với các giải pháp của nó trong thời gian thực, ba luồng bổ sung phải được nhập vào chương trình, vì việc đọc dữ liệu từ micrô, xử lý âm thanh, âm thanh phát qua card âm thanh xảy ra không đồng bộ.

Nhiệm vụ cuối cùng được thực hiện đơn giản bằng chức năng SendInput.

Sự quan tâm lớn nhất, dường như đối với tôi, đại diện cho các nhiệm vụ thứ hai và thứ ba. Vì thế.

Nhiệm vụ số 2. Có được 13 hệ số Kepstan

Nếu ai đó không có trong chủ đề - vấn đề chính của việc nhận ra âm thanh với máy tính như sau: rất khó để so sánh hai âm thanh, vì hai âm thanh không thể xảy ra trên các sóng âm thanh phác thảo có thể nghe tương tự từ quan điểm về nhận thức của con người.

Và trong số những người đối phó với nhận dạng giọng nói, có một cuộc tìm kiếm "đá triết học" - một tập hợp các dấu hiệu chắc chắn sẽ phân loại một làn sóng âm thanh.

Từ những dấu hiệu có sẵn cho công chúng và được mô tả trong sách giáo khoa, cái gọi là hệ số Kepstal tần số phấn (MFCC) đã nhận được sự phân phối lớn nhất (MFCC).

Lịch sử của họ là ban đầu họ được dự định hoàn toàn cho người khác, cụ thể là để ngăn chặn tiếng vang trong tín hiệu (bài viết về tiếng Anh về chủ đề này được viết bởi Oppenheim thân mến và Schafer, và niềm vui sẽ ở trong nhà của những người chồng cao quý này. Xem AV Oppenheim và RW Schafer, từ Tần suất đến Quebrency: Lịch sử của Cepstrum).

Nhưng người được thiết kế để anh ta nghiêng về việc sử dụng những gì anh ta làm quen tốt hơn. Và những người tham gia vào các tín hiệu lời nói, xảy ra để sử dụng đại diện nhỏ gọn được thực hiện của tín hiệu dưới dạng MFCC. Hóa ra, nói chung, nó hoạt động. (Một trong những người quen của tôi, một chuyên gia về hệ thống thông gió, khi tôi yêu cầu anh ta cách tạo ra một gazebo quốc gia, được cung cấp để sử dụng hộp thông gió. Chỉ vì họ biết chúng tốt hơn so với các vật liệu xây dựng khác).

Mfcc là một bộ phân loại tốt cho âm thanh? Tôi sẽ không nói. Âm thanh tương tự được phát âm bởi tôi trong các micro khác nhau rơi vào các khu vực khác nhau của không gian MFCC-CoEfficents và bộ phân loại hoàn hảo sẽ rút chúng gần đó. Do đó, đặc biệt, khi thay đổi micrô, bạn phải re-rèn luyện chương trình.

Đây chỉ là một trong những hình chiếu của không gian MFCC 13 chiều trong 3 chiều, nhưng có thể thấy rằng ý tôi là - Đỏ, màu tím và các điểm màu xanh thu được từ các micro khác nhau: (plantronix, mảng micrô tích hợp , Jabra), nhưng âm thanh đã được thốt ra một mình.

Tuy nhiên, vì tôi không thể cung cấp bất cứ điều gì tốt hơn, cũng yêu cầu phương pháp tiêu chuẩn - tính toán các hệ số MFCC.

Để không phạm sai lầm trong việc triển khai, trong các phiên bản đầu tiên của chương trình làm cơ sở, mã được sử dụng từ chương trình CMU SPHINX nổi tiếng, chính xác hơn, việc triển khai của nó trong C có tên Pocketsphinx, được phát triển tại trường đại học của Carnegie Mellone (thế giới với cả hai! (c) Hottabych).

Mã Pocketsphinx nguồn đang mở, nhưng ở đây là không đủ - nếu bạn sử dụng chúng, bạn nên trong chương trình của mình (cả trong Nguồn và trong mô-đun thực thi) để đăng ký văn bản có chứa, bao gồm các thao tác sau:

* Công việc này được hỗ trợ một phần bằng cách tài trợ từ Cơ quan Dự án Nghiên cứu Quốc phòng Advanced * và Quỹ khoa học quốc gia của CMU Spenhinx Speech Consortium.
Dường như tôi không thể chấp nhận được, và tôi phải viết lại mã. Điều này ảnh hưởng đến tốc độ của chương trình (bằng cách tốt hơn, theo cách, mặc dù "khả năng đọc" của mã có phần bị ảnh hưởng). Theo nhiều cách, nhờ vào việc sử dụng các thư viện "nguyên thủy hiệu suất của Intel", nhưng cũng là thứ khác được tối ưu hóa, giống như một bộ lọc Mel. Tuy nhiên, kiểm tra dữ liệu thử nghiệm cho thấy các hệ số MFCC thu được hoàn toàn tương tự như những gì thu được bằng cách sử dụng, ví dụ, tiện ích SPHINX_FE.

Trong các chương trình SPHINXBASE, tính toán hệ số MFCC được thực hiện theo các bước sau:

Bươc Tính năng Sphinxbase. Bản chất của hoạt động
1 fe_pre_emphocation. Từ tài liệu tham khảo hiện tại, hầu hết các tài liệu tham khảo trước đó đều được trừ (ví dụ: 0,97 từ giá trị của nó). Bộ lọc nguyên thủy loại bỏ tần số thấp hơn.
2 fe_hamming_window. Cửa sổ trò đùa - làm suy giảm ở đầu và cuối khung
3 fe_fft_real. Chuyển đổi Fourier nhanh.
4 fe_spec2magnitude. Từ phổ thông thường, chúng ta có được phổ điện, pha thua
5 fe_mel_spec. Chúng tôi nhóm tần số phổ [ví dụ, 256 miếng] trong 40 loại máu sử dụng hệ số có quy mô mel và trọng lượng
6 fe_mel_cep. Chúng tôi lấy logarit và áp dụng chuyển đổi DCT2 thành 40 giá trị từ bước trước đó.
Để lại 13 kết quả đầu tiên của kết quả.
Có một số biến thể của DCT2 (HTK, Legacy, Classic), khác nhau về hằng số mà chúng ta chia các hệ số kết quả và hằng số đặc biệt đối với hệ số không. Bạn có thể chọn bất kỳ tùy chọn, nó sẽ không thay đổi nó.

Các bước này vẫn còn các chức năng nghiêng cho phép bạn tách tín hiệu khỏi tiếng ồn và từ im lặng, chẳng hạn như fe_track_snr, fe_vad_hangover, nhưng chúng không cần chúng và chúng tôi sẽ không bị phân tâm.

Các thay thế sau đây đã được thực hiện để các bước để có được các hệ số MFCC:

Nhiệm vụ số 3. Kiểm tra những gì được phát âm là một trong 6 âm thanh ghi nhớ

Trong chương trình "Bộ điều khiển giọng hát" ban đầu, Perceptron nhiều lớp (MLP) đã được sử dụng để phân loại - một mạng lưới thần kinh mà không cần người mới.

Hãy xem cách hợp lý việc sử dụng mạng thần kinh ở đây.

Nhớ lại rằng các tế bào thần kinh được thực hiện trong các mạng thần kinh nhân tạo.

Nếu Neuron N Inlets, thì Neuron phân chia không gian N-Dimensional làm đôi. Chucks với siêu phe điển hình. Đồng thời, trong một nửa không gian nó hoạt động (nó đưa ra một câu trả lời tích cực), và mặt khác - không hoạt động.

Hãy nhìn vào [thực tế] tùy chọn dễ nhất - Neuron với hai đầu vào. Nó sẽ tự nhiên chia sẻ không gian hai chiều làm đôi.

Giả sử rằng các giá trị X1 và X2 được đưa vào đầu vào, mà tế bào thần kinh nhân lên các hệ số trọng lượng W1 và W2 và thêm một thành viên miễn phí của C.


Tổng cộng với kết quả của tế bào thần kinh (chúng tôi biểu thị nó cho y) chúng tôi nhận được:

Y \u003d x1 * w1 + x2 * w2 + c

(Giảm sự tinh tế về chức năng sigmoid chưa)

Chúng tôi tin rằng Neuron được kích hoạt khi Y\u003e 0. Trực tiếp, được đưa ra bởi phương trình 0 \u003d x1 * w1 + x2 * w2 + c Chỉ cần chia không gian thành một phần trong đó y\u003e 0, và một phần của y<0.

Chúng tôi minh họa các số cụ thể cho biết.

Đặt W1 \u003d 1, W2 \u003d 1, C \u003d -5;

Bây giờ chúng ta hãy xem cách chúng ta tổ chức một mạng lưới thần kinh đã kích hoạt trên một số lĩnh vực không gian, thông thường nói - một vị trí và không hoạt động ở tất cả các nơi khác.

Từ hình người ta thấy rằng để phác thảo khu vực trong không gian hai chiều, chúng ta sẽ cần ít nhất 3 trực tiếp, nghĩa là 3 nơon liên quan.

Ba tế bào thần kinh này chúng ta kết hợp với nhau với một lớp khác, đã nhận được một mạng lưới thần kinh nhiều lớp (MLP).

Và nếu chúng ta cần một mạng lưới thần kinh để làm việc trong hai lĩnh vực không gian, sẽ mất ít nhất ba tế bào thần kinh (4,5,6 trong các số liệu):

Và ở đây, không có lớp thứ ba, bạn không thể làm:

Và lớp thứ ba gần như đang học ...

Bây giờ hãy chuyển sang trợ giúp cho một ví dụ khác. Hãy để mạng lưới thần kinh của chúng tôi phải đưa ra phản ứng tích cực ở các chấm đỏ và âm - ở các chấm màu xanh.

Nếu tôi được yêu cầu cắt đới thẳng đỏ từ màu xanh, tôi sẽ làm điều đó bằng cách nào đó:

Nhưng mạng lưới thần kinh của một tiên nghiệm không biết nó sẽ cần bao nhiêu trực tiếp (tế bào thần kinh). Tham số này phải được đặt trước khi kết nối mạng. Và đây là một người dựa trên ... trực giác hoặc mẫu và lỗi.

Nếu chúng ta chọn quá ít tế bào thần kinh trong lớp đầu tiên (ví dụ như ba), chúng ta có thể đến đây một cách cắt như vậy sẽ cho rất nhiều lỗi (khu vực sai lầm được tô bóng):

Nhưng ngay cả khi số lượng tế bào thần kinh là đủ, do kết quả của việc tập luyện, mạng không thể "không rơi", nghĩa là, để đạt được một số trạng thái ổn định, xa tối ưu, khi tỷ lệ lỗi sẽ cao. Như ở đây, thanh ngang trên nằm xuống hai bướu và sẽ không rời khỏi chúng ở bất cứ đâu. Và dưới nó một khu vực rộng lớn tạo ra lỗi:

Một lần nữa, khả năng các trường hợp như vậy phụ thuộc vào các điều kiện đào tạo ban đầu và trình tự đào tạo, nghĩa là, từ các yếu tố ngẫu nhiên:

- Bạn nghĩ gì sẽ đến để có được bánh xe nếu tôi xảy ra, ở Moscow hoặc sẽ không đến?
- Bạn nghĩ gì, bạn sẽ xuống mạng thần kinh hay không thể đi xuống?

Có một khoảnh khắc khó chịu khác liên quan đến các mạng thần kinh. "Sự lãng quên" của họ.

Nếu bạn bắt đầu cho mạng chỉ cho mạng các chấm màu xanh và ngừng cho ăn màu đỏ, thì nó có thể bình tĩnh lấy một mảnh vùng màu đỏ, di chuyển đường viền của nó ở đó:

Nếu các mạng thần kinh có rất nhiều lỗ hổng, và một người có thể thực hiện ranh giới hiệu quả hơn nhiều một mạng lưới thần kinh, tại sao sau đó sử dụng chúng ở tất cả?

Và có một mặt hàng nhỏ, nhưng rất quan trọng.

Tôi rất có thể tách trái tim màu đỏ khỏi nền màu xanh với các phần trực tiếp trong không gian hai chiều.

Tôi có thể tách Tượng Sao Kim khỏi không gian ba chiều xung quanh nó.

Nhưng trong không gian bốn chiều, tôi không thể làm bất cứ điều gì, xin lỗi. Và trong 13 chiều - đặc biệt là.

Nhưng đối với mạng lưới thần kinh, kích thước của không gian không phải là một trở ngại. Tôi cười nhạo cô ấy trong không gian của một chiều nhỏ, nhưng nó đáng để vượt xa trần tục, như cô ấy dễ dàng làm tôi.

Tuy nhiên, câu hỏi vẫn còn mở - cách biện minh cho việc sử dụng mạng thần kinh trong nhiệm vụ cụ thể này, do thiếu mạng lưới thần kinh được liệt kê ở trên.

Quên một giây rằng các hệ số MFCC của chúng tôi nằm trong không gian 13 chiều và hãy tưởng tượng rằng chúng có hai chiều, nghĩa là, điểm trên mặt phẳng. Làm thế nào một âm thanh có thể được tách ra khỏi cái kia trong trường hợp này?

Đặt âm thanh MFCC Sound of Sound 1 có độ lệch riconductic R1, mà [thô] có nghĩa là các điểm không quá lệch so với mức trung bình, các điểm đặc trưng nhất nằm trong vòng tròn với bán kính R1. Tương tự, các điểm chúng ta tin tưởng vào âm thanh 2 nằm trong một vòng tròn với bán kính R2.

CHÚ Ý, CÂU HỎI: Nơi dành một đường thẳng, điều này sẽ tách biệt âm thanh 1 từ âm thanh nào?

Trả lời câu trả lời: ở giữa giữa ranh giới của các vòng tròn. Có bất kỳ sự phản đối? Không có phản đối.
Điều chỉnh: Trong chương trình, biên giới này chia phân đoạn kết nối các trung tâm của các vòng tròn trong tỷ lệ R1: R2, rất chính xác hơn.

Và cuối cùng, đừng quên rằng một nơi nào đó trong không gian có một điểm là bản trình bày về sự im lặng hoàn toàn trong không gian MFCC. Không, nó không phải là 13 số không, như nó có vẻ. Đây là một điểm trong đó không thể có độ lệch vuông trung bình. Và các đường thẳng chúng ta sẽ cắt nó từ ba âm thanh của chúng tôi, bạn có thể chi tiêu trực tiếp trên ranh giới của các vòng tròn:

Trong hình dưới đây, mỗi âm thanh tương ứng với một phần của màu sắc của màu sắc và chúng ta luôn có thể nói rằng một hoặc một điểm khác của không gian bao gồm (hoặc không áp dụng cho bất kỳ):

Chà, tốt, và bây giờ hãy nhớ rằng không gian là 13 chiều, và những gì vẽ tốt trên giấy, bây giờ hóa ra nó không phù hợp với não người.

Vì vậy, không như vậy. May mắn thay, trong không gian của bất kỳ chiều nào, các khái niệm như một điểm, đường thẳng thẳng, mặt phẳng [Hyper], [Hyper] Sphere vẫn còn.

Chúng tôi lặp lại tất cả các hành động tương tự và trong không gian 13 chiều: chúng tôi tìm thấy sự phân tán, xác định Radii [Hyper] của các quả cầu, kết nối các trung tâm của chúng thẳng, chà nó [Hyper] đến mặt phẳng tại một điểm xa cách ranh giới [Hyper] Spheres.

Không có mạng thần kinh có thể tách đúng hơn một âm thanh từ bên kia.

Tuy nhiên, ở đây, việc đặt phòng nên được thực hiện. Tất cả điều này là đúng nếu thông tin về âm thanh là một đám mây của các điểm lệch từ mức trung bình như nhau theo mọi hướng, nghĩa là, phù hợp với quá trình siêu cường. Nếu đám mây này là một hình dạng của một hình thức phức tạp, ví dụ, xúc xích cong 13 chiều, thì tất cả các lý luận trên sẽ không chính xác. Và có lẽ, với đào tạo thích hợp, mạng lưới thần kinh có thể thể hiện ở đây điểm mạnh của họ.

Nhưng tôi sẽ không tăng. Và chúng tôi sẽ áp dụng, ví dụ, các bộ phân phối thông thường (GMM), (theo cách, nhân tiện, được thực hiện trong CMU SPHINX). Luôn dễ chịu hơn khi bạn hiểu cụ thể thuật toán đã dẫn đến kết quả. Và không phải như trong mạng lưới thần kinh: Oracle, dựa trên nhiều giờ của nước dùng từ dữ liệu để đào tạo, ra lệnh cho bạn quyết định rằng âm thanh được yêu cầu là âm thanh số 3. (Tôi đặc biệt làm phiền tôi khi mạng lưới thần kinh đang cố gắng giao phó sự kiểm soát của chiếc xe. Làm thế nào sau đó trong một tình huống không chuẩn, vì những gì chiếc xe rẽ trái, và không đúng? Neuron toàn năng chỉ huy?).

Nhưng các phân phối bình thường là một chủ đề lớn riêng biệt vượt quá phạm vi của bài viết này.

Tôi hy vọng rằng bài viết rất hữu ích, và / hoặc buộc bộ não của bạn chìm xuống ọp ẹp.