Cách chuyển đổi một tài liệu đã quét sang định dạng Word. Cách dịch tài liệu được quét sang Word

Nếu bạn cần một bản sao điện tử của một tài liệu in, máy quét là một trợ thủ đắc lực. Tuy nhiên, thường yêu cầu một tài liệu được quét không chỉ ở định dạng đồ họa mà còn ở định dạng văn bản.

Bạn sẽ cần

  • FineReader hoặc chương trình tương tự

Hướng dẫn

1. Để dịch một tài liệu đã quét sang Word, bạn cần nhận dạng văn bản trên đó. Để thực hiện việc này, hãy sử dụng một chương trình như ABBYY FineReader, được chuẩn bị cho các tác vụ tương tự. Ngoài ra, sử dụng giao diện của chương trình này, bạn cũng có thể quét tài liệu. Là một chất tương tự của FineReader, bạn có thể sử dụng các chương trình như CuneiForm, Readiris Pro, Free OCR, SimpleOCR, v.v.

2. Để bắt đầu nhận dạng văn bản trong tài liệu được quét, hãy mở tài liệu đó trong chương trình đã chọn. Nếu tài liệu có nhiều trang, hãy chỉ định phạm vi trang mà bạn muốn nhận dạng. Bạn cũng có thể chỉ ra một khu vực trên trang được chuẩn bị để công nhận. Ngoài ra, nó được phép ưu tiên ngôn ngữ của văn bản trong tài liệu được công nhận, các giá trị trường và các tham số khác. Bấm vào nút "Nhận biết".

3. Sau khi hoàn thành thủ tục nhận dạng, văn bản kết quả sẽ mở ra trong một cửa sổ bổ sung. Bạn có thể kiểm tra nó và giới thiệu các biến thái theo cách thủ công bằng cách sửa các lỗi do chương trình tạo ra, nếu có. Bạn có thể bỏ qua bước này và quay lại chỉnh sửa văn bản một cách thoải mái sau khi lưu tài liệu. Sau đó nhấp vào nút "Lưu".

4. Bạn sẽ được nhắc lưu văn bản đã chỉnh sửa ở một trong số các định dạng. Chúng tôi lo lắng về định dạng Microsoft Word. Chọn định dạng .doc, đặt tên cho tài liệu sẽ lưu và lưu nó. Nhiệm vụ đã hoàn thành - tài liệu được quét đã được dịch sang Word.

Khi làm việc với các tài liệu, người ta thường phải dịch sang một tờ in dưới định dạng của tài liệu MS Word để chỉnh sửa thêm và tăng sự thoải mái khi sử dụng. Đối với lần quét sau này chữ bạn cần phải nhận ra nó. Có rất nhiều chương trình công nhận. Để đạt được kết quả tối đa, việc chạy tài liệu để nhận dạng và lưu tệp, tệp đã xuất bản là điều không thể thực hiện được.

Hướng dẫn

1. Trước hết, hãy đảm bảo rằng phiên bản được quét của tài liệu càng rõ ràng càng tốt, không có các đốm màu không cần thiết, làm mờ và phơi sáng quá mức. chữ... Quét lại văn bản nếu cần.

2. Chạy chương trình nhận dạng chữ... Chương trình cung cấp kết quả tốt nhất trong lĩnh vực này là ABBYY FineReader. Tải xuống và cài đặt phiên bản mới nhất của trình nhận dạng này, sau đó chạy nó sau.

3. Sử dụng menu “Tệp”, thêm các trang đã quét vào danh sách OCR. Để đơn giản hóa công việc, bạn không nên nhận ra từng người một mà hãy bắt đầu mọi thứ cùng một lúc. Hãy nhớ rằng các chương trình nhận dạng có thể nhận dạng lên đến mười nghìn trang cùng một lúc và không nhiều hơn. Chờ kết luận xem xét và công nhận chữ .

4. Sau khi chương trình tải các tệp của bạn, hãy đặt ngôn ngữ nhận dạng. Ngay sau đó, tiến hành lựa chọn khu vực để công nhận. Để thực hiện việc này, hãy xóa tất cả các khu vực được chương trình chọn một cách máy móc và chọn chúng theo cách thủ công. Cung cấp cho trường chất lượng "văn bản" hoặc "hình ảnh", tùy thuộc vào chất lượng của nó.

5. Bắt đầu quá trình nhận dạng. Sau đó trong phần kết luận, hãy chọn định dạng mà bạn sẽ lưu và kiểu định dạng mà bạn muốn quan sát khi lưu.

Thường xảy ra trường hợp cần chỉnh sửa văn bản chỉ có trong phiên bản giấy. Để nhận dạng và chỉnh sửa tại thời điểm này, có nhiều chương trình không chỉ khác nhau về chất lượng của kết quả mà còn về chức năng nâng cao. Fine Reader là một trong những ứng dụng tốt nhất hiện có để thực hiện điều này.

Bạn sẽ cần

  • - trình soạn thảo văn bản;
  • - Chương trình Fine Reader.

Hướng dẫn

1. Tải xuống và cài đặt một chương trình nhận dạng văn bản được quét, chẳng hạn như Fine Reader. Kiểm tra chức năng của chương trình - nhiều phiên bản hiện đại hỗ trợ tích hợp văn bản được quét trực tiếp vào Word, nếu chức năng như vậy có sẵn trong bản sao chương trình của bạn, hãy thực hiện thao tác bằng cách bỏ qua các điểm sau.

2. Nếu bạn có các phiên bản chương trình đã lỗi thời, hãy quét tài liệu bạn cần để chỉnh sửa bằng chương trình chuẩn của thiết bị sao chép mà bạn thường sử dụng và lưu nó ở định dạng .jpg trên máy tính của bạn.

3. Click một lần bằng nút chuột phải vào hình ảnh đã lưu, chọn "Open with ..." và trong danh sách chương trình hiện ra, chọn Fine Reader mà bạn vừa cài đặt. Nếu cần, hãy chọn hộp bên cạnh Áp dụng cho tất cả dữ liệu cho các tệp thuộc loại này. Trước tiên, bạn cũng có thể quét hình ảnh bằng một chương trình mở chặt chẽ hơn, ưu tiên mục “Quét và đọc”, trong khi hình ảnh từ thiết bị được nhập trực tiếp vào không gian làm việc. Để thực hiện việc này, trong cài đặt, hãy chỉ định trước các thông số của máy quét ở chế độ chương trình Fine Reader.

4. Trong cửa sổ chương trình mở ra, chọn mục "Nhận dạng văn bản". Chờ chương trình đọc tài liệu. Nếu kết quả của thao tác không đáp ứng yêu cầu của bạn, hãy thay đổi cài đặt quét và nhận dạng và lặp lại quy trình một lần nữa.

5. Lưu tài liệu kết quả ở bất kỳ định dạng nào được Microsoft Office Word hỗ trợ. Đóng Fine Reader, điều hướng đến thư mục bạn đã lưu tài liệu của mình.

6. Mở tệp bằng MS Office Word hoặc bất kỳ trình soạn thảo văn bản nào khác mà bạn cảm thấy thoải mái khi làm việc. Thực hiện các phép biến thái cần thiết trong tệp, lưu kết quả.

Ghi chú!
Đặc biệt chú ý đến cài đặt quét, nếu không, hãy đặt trước các thông số cần thiết.

Lời khuyên hữu ích
Chỉ tải xuống chương trình từ trang web chính thức của Abbyy.

Máy quét và các thiết bị đa chức năng (MFP) đã ăn sâu vào cuộc sống của người dùng máy tính. Để làm việc thành công với các thiết bị này, bạn phải tuân theo các quy tắc nhất định.

Bạn sẽ cần

  • - máy quét;
  • - Chương trình đọc file PDF trên máy tính.

Hướng dẫn

1. Đảm bảo rằng máy quét được kết nối với máy tính của bạn và tất cả các trình điều khiển cần thiết đã được cài đặt cho thiết bị này. Mở nắp của máy quét hoặc MFP và đặt tài liệu cần thiết sao cho mặt cần quét hướng xuống dưới. Nhấn nút bắt đầu quá trình quét và chờ kết thúc thao tác này.

2. Một số MFP cho phép các chương trình đặc biệt để điều khiển thiết bị. Chạy tiện ích này và nhấp vào nút "Quét". Sau đó, kết luận của quá trình này sẽ mở một cách cơ học thư mục lưu tài liệu đã quét.

3. Một số phần mềm không lưu dữ liệu đã quét một cách máy móc. Theo truyền thống, trong những trường hợp như vậy, việc mở chương trình chuẩn bị để đọc tài liệu được thực hiện. Nếu bạn gặp phải loại MFP này, thì sau khi mở tài liệu đã quét, hãy nhấn tổ hợp phím Ctrl và S. Chọn thư mục bạn muốn lưu hình ảnh và nhập tên tệp.

4. Việc lựa chọn phần mềm hoàn toàn là trách nhiệm của bạn. Thông thường, các chương trình DjvuReaser hoặc Adobe Reader được sử dụng để làm việc với các tài liệu được quét. Đảm bảo chọn định dạng phù hợp với bạn khi điều chỉnh cài đặt quét.

5. Chỉnh sửa tài liệu ngay sau khi kết thúc quá trình quét. Chỉ cắt phần bạn cần. Chỉnh sửa hình ảnh bằng các chương trình đặc biệt. Loại bỏ các vệt đen nếu chúng xuất hiện sau khi quét. Để đảm bảo các tài liệu được quét chất lượng cao, hãy chọn các tùy chọn thích hợp cho MFP. Tốt hơn là áp dụng màu sắc của hình ảnh thành 8 bit, và số điểm trên mỗi inch không ít hơn 150.

Lời khuyên hữu ích
Khi quét ảnh, tốt hơn nên áp dụng những cài đặt cho phép bạn cung cấp chất lượng tốt nhất của ảnh thu được.

Máy quét được chuẩn bị để tạo bản sao kỹ thuật số của hình ảnh. Tài liệu đã quét có thể được lưu dưới dạng ảnh hoặc dịch sang chữđịnh dạng. Tất cả phụ thuộc vào kết quả cuối cùng mà người dùng muốn nhận được và những ứng dụng anh ta sử dụng cho công việc.

Hướng dẫn

1. Theo mặc định, máy quét lưu hình ảnh đã chụp dưới dạng tệp .jpg, .bmp hoặc .tiff - đây là định dạng đồ họa. Nó được phép làm việc với các tệp loại này trong trình chỉnh sửa đồ họa: thay đổi độ phân giải, độ tương phản, độ sáng của tài liệu hoặc sử dụng các kết quả trực quan khác. Định dạng .pdf đa nền tảng cung cấp các khả năng xử lý hình ảnh hơi khác nhau, tuy nhiên, để làm việc với tài liệu được quét ở định dạng văn bản, bạn cần sử dụng một chức năng riêng biệt máy quét, hoặc một ứng dụng nhận dạng văn bản đặc biệt.

2. Nghiên cứu xác suất của máy quét... Đối với nhiều mô hình, các nhà phát triển cung cấp một tiện ích để chuyển đổi hình ảnh được quét thành văn bản; nó được cung cấp cùng với thiết bị và nằm trên đĩa cài đặt. Trên menu máy quét tùy chọn này được gọi là "Nhận dạng Văn bản" hoặc OCR (Nhận dạng Ký tự Quang học). Nếu tùy chọn này không khả dụng, hãy cài đặt ứng dụng của bên thứ ba, chẳng hạn như Fine Rider.

3. Chọn từ menu máy quét hoặc lập trình nút tương ứng và đợi kết thúc quá trình quét. Sau đó, thông tin từ tài liệu có thể được dịch một cách máy móc sang chữđịnh dạng và mở trong notepad, hoặc bạn sẽ cần thực hiện một vài bước bổ sung.

4. Nếu văn bản được xuất sang tệp .txt, hãy lưu tài liệu bằng phương pháp thông thường hoặc sao chép nội dung của nó và dán vào tài liệu có định dạng khác, chẳng hạn như .doc (.docx). Nếu bạn vẫn thấy văn bản dưới dạng hình ảnh, hãy chọn bước "Nhận dạng" và đợi quá trình hoàn tất. Sau đó, chọn lệnh "Xuất" hoặc sao chép văn bản được nhận dạng và dán vào tài liệu ở định dạng phù hợp với bạn.

5. Chất lượng "bản dịch" của văn bản máy quét phụ thuộc rất nhiều vào cài đặt độ phân giải mà bạn chọn. Độ phân giải càng cao, máy quét sẽ tạo ra bản sao chính xác hơn. Khi bạn định dịch ảnh thành văn bản, tùy chọn tốt nhất sẽ là cài đặt độ phân giải trung bình. Nếu độ phân giải quá thấp, bản sao sẽ không quá rõ ràng và do đó văn bản sẽ khó nhận ra hơn. Nếu độ phân giải quá cao, thì nhiễu phụ cũng sẽ gây khó khăn cho việc dịch đồ họa thành văn bản.

Chương trình Microsoft Word cung cấp cho người dùng một tùy chọn tiện lợi cho phép họ dịch các văn bản đã nhập chữ... Không còn cần thiết phải đào sâu vào từ điển để tìm bản dịch của các từ hoặc sử dụng các chương trình dịch. Nó khá sơ khai để khởi động Word.

Bạn sẽ cần

  • - máy vi tính;
  • - Internet.

Hướng dẫn

1. Khởi chạy chương trình Microsoft Word trên máy tính của bạn. Phiên bản của chương trình này ít nhất phải là 2003.

2. Nhập văn bản bạn cần dịch, kiểm tra lỗi chính tả. Bất kỳ sự không chính xác nào cũng có thể gây khó khăn cho việc dịch văn bản của chương trình hoặc làm sai lệch ý nghĩa của nó. Đánh dấu văn bản đã nhập và nhấp vào tab "Xem lại" trong menu chính. Trong menu mở ra, chọn dòng chữ "Chuyển". Sau đó, một cửa sổ "Tham khảo" sẽ xuất hiện ở bên trái của trang.

3. Cho phép mở cửa sổ này và hơn thế nữa bằng một phương pháp đơn giản. Chọn văn bản hoặc đoạn cần thiết, nhấp chuột phải vào nó, chọn “Dịch” từ menu ngữ cảnh xuất hiện.

4. Trong cửa sổ mở ra, chỉ định ngôn ngữ bắt đầu và ngôn ngữ đích. Sau đó, chương trình sẽ xuất ra văn bản đã dịch bên dưới. Cũng có thể thiết lập các thông số dịch nhất định bằng cách nhấp vào dòng chữ cùng tên trong "Tài liệu Tham khảo". Trong cửa sổ xuất hiện, hãy đặt dấu kiểm bên cạnh "Sử dụng từ điển trên Internet". Điều này sẽ tạo điều kiện cho bản dịch hoàn hảo hơn.

5. Sau khi văn bản yêu cầu đã được dịch, hãy nhấp vào nút "Chèn" bên dưới văn bản đó. Và trong tài liệu của bạn, văn bản bằng một ngôn ngữ khác sẽ xuất hiện ở vị trí của bài kiểm tra ban đầu.

6. Nếu không có nút này, dễ dàng chọn bản dịch, nhấp chuột phải vào nó, chọn "Sao chép". Và sau đó dán nó vào vị trí của văn bản bắt đầu. Bản dịch sẽ được hoàn thành.

7. Nó được phép dịch không phải toàn bộ văn bản mà là một đoạn hoặc từ nhất định. Để thực hiện việc này, hãy chọn phần tử yêu cầu dịch và áp dụng tất cả các bước được mô tả ở trên cho phần tử đó.

8. Hãy nhớ rằng khi dịch, máy tính chỉ truyền đạt ý nghĩa chung của các câu. Vì vậy, bạn không nên sử dụng văn bản đã dịch trong các tài liệu kinh doanh hoặc thư từ.

Ghi chú!
Để dịch văn bản sang Word, chắc chắn máy tính phải được kết nối Internet. Đó là từ đó dữ liệu cho việc chuyển giao được thực hiện.

Sách luôn luôn là chủ đề của trí tuệ đối với con người. Trong một thời gian dài, sách là công cụ để lại cho bản thân bạn ít nhất một số lịch sử hoặc thông tin sau này. Dù là sách gì đi nữa, tất cả đều bắt đầu từ những viên đất sét, được thay thế từng viên một bằng giấy da, giấy cói, vỏ cây bạch dương và giấy. Và sự hình thành của sách không dừng lại ở đó. Ngày nay, ngày càng có nhiều người sử dụng cái gọi là "sách điện tử" để đọc.

Bạn sẽ cần

  • - máy vi tính
  • - máy ảnh hoặc máy quét
  • - chương trình đặc biệt

Hướng dẫn

1. Mỗi người trong một vài bước được phép chuyển người yêu của mình quyển sách từ giấy đóng thành văn bản in trên máy tính. Để quyển sách không dễ dàng để dịch nó thành văn bản điện tử, nhưng nó cũng rất thoải mái khi mở trên bất kỳ máy tính nào, định dạng Doc phù hợp hơn bất kỳ định dạng nào, mở được với nhiều trình soạn thảo văn bản, kể cả Word yêu thích của mọi người.

2. Trước hết, bạn cần sao chép các trang bằng cách quét hoặc chụp ảnh. Trong trường hợp này, các phiên bản điện tử của các trang được lấy ngay lập tức, nhưng cho đến nay ở định dạng ảnh Jpg nén. Tất nhiên là cho phép, để như vậy thì sẽ khá thoải mái khi “lướt qua” các em, nhưng đọc lâu văn bản trong trường hợp này sẽ không được đẹp và hợp mắt cho lắm.

3. Để biến văn bản thông thường ra khỏi ảnh chụp nhanh, bạn cần nhận ra nó. Điều này được thực hiện một cách đáng kinh ngạc với sự trợ giúp của các chương trình đặc biệt, một trong số đó bạn cần phải có trên máy tính của mình hoặc cài đặt nó. Một số cái nổi tiếng nhất là Fine Reader và CuneiForm.

5. Ngay sau khi chương trình tạo văn bản từ tệp Jpg, nó sẽ được phép lưu nó ở các định dạng văn bản khác nhau, bao gồm cả định dạng Doc. Như vậy, có thể dễ dàng nhận được một tập tin với một cuốn sách ở dạng điện tử.

Lời khuyên hữu ích
Sau đó, nếu muốn, nó được phép dịch định dạng này sang bất kỳ định dạng thuận tiện nào để tạo toàn bộ sách điện tử, có thể là Pdf, DjVu, Rtf, Fb2 và các định dạng khác. Để làm điều này, bạn cần bất kỳ trình chuyển đổi phù hợp nào cho các loại định dạng nhất định. Trước khi chuyển đổi, hãy kiểm tra văn bản, xếp hàng và hình ảnh phù hợp với sách, nếu cần, và tạo bản sao sách điện tử của bạn. Nó cũng được phép chuyển đổi theo chiều ngược lại từ các định dạng trên sang Doc để đọc trong Word.

Ghi chú!
Tùy thuộc vào chương trình đã chọn để nhận dạng tài liệu được quét, tên của các phần tử chương trình, cũng như các thông số được thiết lập bổ sung, có thể hơi khác nhau. Tuy nhiên, thuật toán chung để làm việc với chương trình vẫn không thể lay chuyển một cách độc lập với sản phẩm phần mềm bạn đã chọn.

Thật thuận tiện và an toàn để lưu trữ các tài liệu đã quét trên ổ cứng máy tính hoặc phương tiện bên ngoài của bạn. Tuy nhiên, làm cách nào để bạn thực hiện thay đổi đối với các trang thường ở dạng hình ảnh? Chúng tôi cần các chương trình đặc biệt, việc cài đặt và quản lý chúng sẽ mô tả bên dưới.

Làm cách nào để quét tài liệu trước khi chỉnh sửa?

Để thao tác thành công tệp trong tương lai, điều quan trọng là phải dịch chính xác tệp đó sang định dạng “ảnh”, cũng như tính đến một số sắc thái đơn giản nhưng hữu ích trong chính quá trình này. Đối với điều này:

  • Làm phẳng mọi nếp gấp và nếp gấp để chúng không xuất hiện trên bản quét và không dẫn đến khó nhận dạng chữ cái.
  • Lưu tệp ở định dạng PDF, JPG hoặc TIFF để dễ dàng tham khảo.
  • Tài liệu PDF có thể được mở và chỉnh sửa bằng Adobe Acrobat (hoặc bất kỳ tài liệu nào khác được thiết kế cho các mục đích tương tự).
  • Truy cập trang web của công ty tạo ra máy quét hoặc tìm kiếm một chương trình độc quyền trên đĩa kèm theo (thường các hãng nổi tiếng có ứng dụng riêng để sửa đổi các trang được quét).
  • Để sử dụng tệp sau này trong MS Office 2003 hoặc 2007, hãy cài đặt tiện ích Quét Tài liệu Microsoft Office. Nó tự động chuyển đổi tệp đã quét, dịch trực tiếp thành văn bản (chương trình không hoạt động với các phiên bản Office "gần đây" hơn).
  • Bạn nên quét đen trắng thay vì quét màu - điều này giúp đơn giản hóa việc phân tích văn bản.
  • Định dạng TIFF được sử dụng tốt nhất cho bộ chuyển đổi OCR, tức là các chương trình tạo ra nhận dạng quang học.

Cách chỉnh sửa tài liệu được quét - Sử dụng các tiện ích OCR

Nguyên tắc của phương pháp Nhận dạng Ký tự Quang học là việc đọc các ký tự có sẵn trên giấy và so sánh chúng sau đó với các phần tử từ cơ sở dữ liệu của riêng chúng tôi. Do đó, một hình ảnh rắn được chuyển đổi thành văn bản có thể chỉnh sửa. Ví dụ minh họa về các chương trình có thể đối phó với nhiệm vụ này là Adobe Acrobat và Evernote. Để thực hiện các chỉnh sửa đối với bản quét hiện có, chỉ cần mở nó bằng một trong các ứng dụng này, toàn bộ quá trình tiếp theo sẽ diễn ra tự động. Khi chương trình kết thúc nhận dạng, nó sẽ nhắc người dùng lưu tài liệu ở một trong các định dạng có sẵn.


Cách chỉnh sửa một tệp PDF đã quét

Nếu tài liệu quét được lưu dưới dạng tệp PDF, chúng ta có thể dễ dàng chỉnh sửa nó trong Acrobat DC. Đối với điều này:

  • mở menu "Công cụ" -> "Chỉnh sửa PDF";
  • chương trình bắt đầu quá trình chỉnh sửa bằng cách hiển thị menu gợi ý ở góc trên cùng bên phải;
  • bằng cách nhấp vào nó và chọn "Tùy chọn", bạn có thể chỉ định ngôn ngữ nhận dạng;
  • để thực hiện các thay đổi, chỉ cần nhấp vào bất kỳ dòng nào của tài liệu;
  • một tài liệu được mở để chỉnh sửa qua OCR được kèm theo một bảng cài đặt đặc biệt nằm ở phía bên phải của màn hình;
  • Trong phần “Cài đặt”, ngoài ngôn ngữ, bạn cũng có thể chọn phông chữ hiển thị, đánh dấu các trang cần chỉnh sửa (tất cả hoặc từng trang một) rất tiện lợi.


Có một giải pháp thay thế có thể truy cập được cho các chương trình chuyển đổi đã cài đặt trên World Wide Web. Đây là những OCR trực tuyến có thể dễ dàng dịch hình ảnh thu được sang bất kỳ định dạng văn bản nào. Ví dụ: trang pdfonline.com sẽ cho phép bạn tạo tệp MS Word thông thường từ tài liệu PDF được quét trong vài phút.

Nếu bạn đã chọn con đường nhanh chóng là viết một chương lý thuyết, mà chúng ta đã nói trong đoạn 2.1., Thì rất có thể bạn không thể thực hiện mà không quét tài liệu. Nếu không, bạn có thể bỏ qua điểm này và bắt đầu ghi chú các tài liệu có trong thư viện.

Trước khi bắt đầu quét, bạn cần quyết định chính xác những gì bạn muốn sử dụng khi viết một tác phẩm. Và đối với điều này, trước tiên bạn cần phải xem qua các tài liệu có sẵn và đánh dấu những điểm cần thiết bằng bút chì.

Khi tôi lần đầu tiên đọc một bài báo trên tạp chí cho bài báo học kỳ đầu tiên của mình, điều đó thật khó khăn đối với tôi. Kết quả của vài giờ làm việc với máy quét và FineReader, tôi đã nhận được những thứ vô nghĩa không thể chỉnh sửa. Kết quả là tôi phải gõ mọi thứ bằng tay. Để điều này không xảy ra với bạn, hãy để chúng tôi xem xét chi tiết hơn tất cả các khía cạnh kỹ thuật của quá trình quét.

Tất nhiên, để quét, chúng ta cần một máy quét. Bạn không cần phải mua nó. Ví dụ, bạn có thể mượn từ một người bạn trong một thời gian. Tôi sử dụng máy quét CanoScan Lide 60. Mặc dù đây không phải là kiểu máy mới nhất nhưng tôi thực sự thích “thiết bị” nhỏ gọn, nhanh chóng và dễ sử dụng này. Nếu bạn mượn một máy quét, để nó hoạt động, trước tiên bạn phải cài đặt chương trình điều khiển. Trình điều khiển và hướng dẫn cài đặt luôn có thể tìm thấy trên đĩa cài đặt đi kèm với thiết bị hoặc tải xuống từ trang web của nhà sản xuất. Sau khi cài đặt trình điều khiển, kết nối máy quét với máy tính bằng dây kết nối. Bây giờ bạn có thể bắt đầu quét trực tiếp.

Nhưng trước tiên, một chút lý thuyết. Bạn nên biết rằng quá trình quét bao gồm hai giai đoạn:

1. Quét trực tiếp tài liệu. Ở giai đoạn này, máy quét sẽ chụp ảnh bề mặt của tài liệu được quét và lưu hình ảnh thu được vào máy tính dưới dạng tệp thông thường .jpg .gif hoặc ở định dạng khác;

2. Ghi nhận tài liệu. Đây là quá trình chuyển đổi văn bản từ hình ảnh được thực hiện bởi máy quét thành một bài kiểm tra thông thường, sau đó có thể được lưu trong Word và chỉnh sửa. Nhận dạng được thực hiện mà không cần sự tham gia của máy quét, sử dụng một chương trình đặc biệt (phổ biến nhất là Adobe FineReader). Do đó, trước tiên bạn có thể quét một số trang văn bản và lưu chúng dưới dạng hình ảnh và chỉ sau đó chuyển đổi thành văn bản.

Vì vậy, hãy bắt đầu giai đoạn một - quét:

- chạy trình điều khiển máy quét: Bắt đầu - Tất cả chương trình - Canon - ScanGear(Tôi cho biết tên của trình điều khiển cho máy quét của tôi). Cửa sổ trình điều khiển sẽ xuất hiện:

- mở nắp máy quét và đặt sách, tạp chí hoặc bản sao của chúng có văn bản xuống càng tốt so với các cạnh của bề mặt làm việc của máy quét:

Ở đây, điều rất quan trọng là phải đảm bảo rằng nắp máy quét ép tài liệu được quét càng chặt càng tốt, ngăn ánh sáng bên ngoài chiếu vào bề mặt làm việc của máy quét, nơi tiếp xúc với tài liệu;

- thực hiện các cài đặt cần thiết trong trình điều khiển máy quét. Bước đầu tiên là đặt độ phân giải mà tài liệu sẽ được quét. Độ phân giải là số liệu xác định mức độ chi tiết của đối tượng khi quét và được xác định bằng số chấm trên inch (dpi hoặc dpi). Độ phân giải càng cao thì hình ảnh sẽ càng đẹp. Tuy nhiên, khi quét tài liệu văn bản, không có ý nghĩa gì khi đặt độ phân giải tối đa, vì điều này sẽ không có ý nghĩa gì. Ngoài ra, quá trình quét ở độ phân giải cao hơn sẽ mất nhiều thời gian hơn. Tôi khuyên bạn nên đặt độ phân giải trong phạm vi 400-500 dpi. Với thiết lập này, hình ảnh có chất lượng đủ để nhận dạng tốt và quá trình quét tự nó không mất nhiều thời gian. Tôi khuyên bạn nên xem ảnh chụp màn hình cài đặt máy in của mình:


Trước tiên, bạn cần phải đi đến "Chế độ nâng cao". Nguồn sẽ luôn là "Viên thuốc"(máy quét phẳng). Chế độ màu được đặt tốt nhất "Đen và trắng", bởi vì chúng tôi không cần màu sắc để quét văn bản và điều này sẽ làm giảm kích thước của hình ảnh đầu ra. Sự cho phép, như tôi đã nói, nên được thiết lập 400 dpi... Kích thước hình ảnh đầu ra - bắt buộc "A4"... Bây giờ bạn có thể nhấn nút một cách an toàn "Quét"... Máy quét của tôi được thiết kế theo cách đầu tiên nó ghi nhớ các hình ảnh đã quét trong bộ nhớ trong và chỉ khi cửa sổ trình điều khiển đóng lại, nó mới đề xuất lưu chúng vào máy tính. Tôi chỉ cần chỉ ra nơi mà kết quả của công việc sẽ được lưu.

Bạn sẽ nhận được các tệp thuộc loại này:

Khi một hình ảnh được phóng to, văn bản sẽ được nhìn thấy rõ ràng.

Giai đoạn thứ haisự công nhận các hình ảnh kết quả và chuyển đổi chúng thành văn bản. Như tôi đã nói, điều này đòi hỏi một chương trình đặc biệt - FineReader... Tải xuống chương trình từ liên kết này (32MB). Mật khẩu lưu trữ - trang web... Phiên bản tôi đề xuất không yêu cầu cài đặt (di động). Sẽ có nhiều tệp khác nhau trong thư mục chương trình, nhưng bạn chỉ cần một - FineReader.exe... Nhấp đúp vào tệp này sẽ khởi chạy chương trình trên máy tính của bạn.

Phiên bản này của chương trình đã khá cũ. Tất cả các ảnh chụp màn hình bên dưới tôi đã thực hiện bằng cách sử dụng nó. Nếu phiên bản này FineReader không bắt đầu cho bạn - hãy chọn một cái mới hơn.

Cửa sổ FineReader trông như thế này:

Sau khi cài đặt ngôn ngữ mà các tài liệu đã quét trước đó được in, bạn có thể bắt đầu nhận dạng. Nếu văn bản chứa hai ngôn ngữ cùng một lúc (ví dụ: tiếng Nga và tiếng Anh), hãy thực hiện cài đặt cho phù hợp.

Để bắt đầu nhận dạng, hãy nhấp vào mũi tên ở bên phải của nút đầu tiên Quét- và sau đó - Mở hình ảnh:

Một cửa sổ để chọn hình ảnh sẽ mở ra. Mở thư mục nơi bạn đã lưu các hình ảnh đã quét, nhấp vào CTRL + A(Tiếng Anh) trên bàn phím và nhấn nút Mở ra.

Sau đó, ở bên trái trong cửa sổ FineReader hình thu nhỏ của các tệp đã thêm sẽ xuất hiện ở giữa - hình thu nhỏ hiện được chọn trong chế độ xem được phóng to, bên dưới - độ phóng đại thậm chí còn lớn hơn và ở bên phải - kết quả nhận dạng:

Ví dụ, tôi chỉ chụp hai hình ảnh. Trong ảnh chụp màn hình ở trên, phần đầu tiên trong số chúng được đánh dấu và bây giờ chúng ta sẽ nhận ra nó. Như bạn thấy, hình ảnh được quét theo chiều dọc, để nhận dạng văn bản, hình ảnh trước tiên phải được xoay 90 độ. Để làm điều này, hãy sử dụng các nút và. Bước tiếp theo là cho chương trình biết chính xác phần nào của hình ảnh cần được nhận dạng, cũng như thiết lập loại dữ liệu sẽ được xuất ra dưới dạng văn bản, bảng hoặc hình ảnh. Đối với điều này, có các nút, tương ứng:. Ví dụ: nếu bạn cần đánh dấu một khối văn bản, hãy nhấp chuột trái vào, sau đó nhấp chuột trái vào góc trên bên trái của khối văn bản và trong khi giữ nút bên trái, hãy kéo xuống góc dưới bên phải. Ví dụ: tôi đã chuẩn bị đầy đủ một hình ảnh để nhận dạng:

Như bạn có thể thấy, tất cả các hộp văn bản trong ví dụ trên được đánh dấu bằng màu xanh lá cây và các hình ảnh được đánh dấu bằng màu đỏ. Các bảng được chuẩn bị để nhận dạng theo cách tương tự. Nút này được thiết kế cho việc này. Để chuyển đến hình ảnh tiếp theo, hãy nhấp chuột trái vào hình thu nhỏ của nó ở bên trái. Bằng cách này, tất cả các hình ảnh thu được từ quá trình quét đều được chuẩn bị để nhận dạng. Sau khi chuẩn bị xong hình ảnh, bạn nên chọn tất cả. Để thực hiện việc này, hãy nhấp chuột trái vào một khoảng trống trên bảng hình thu nhỏ (nó được gọi là Túi nhựa) và hãy nhấn Ctrl + A(Tiếng Anh) trên bàn phím. Sau đó nhấp vào nút và đợi cho đến khi FineReader chuyển đổi hình ảnh thành văn bản. Sau đó, bạn có thể lưu văn bản đã nhận trong Word bằng nút, sau khi nhấp vào, một cửa sổ sẽ mở ra. Trong đó, bạn phải chọn định dạng để lưu - Microsoft Word, và cũng chọn hộp để tất cả các trang được lưu:

Sau khi nhấn nút VÂNG chương trình sẽ tạo tài liệu Word và chèn văn bản từ các trang được nhận dạng vào đó theo thứ tự xuất hiện trong bảng hình thu nhỏ (Gói). Lưu tài liệu kết quả vào một thư mục trong cấu trúc tệp của luận văn và bạn có thể bắt đầu chỉnh sửa. Làm thế nào điều này được thực hiện được mô tả trong khóa học miễn phí.

Và giây phút cuối cùng. Nếu bạn quét một tờ báo hoặc tạp chí, văn bản thường được đưa ra trong các cột (như trong ví dụ trên). Các cột này trong Word cần được chuyển đổi thành một. Chọn văn bản trong các cột và chạy lệnh: Định dạng - Cột - Một - OK... Chỉ sau đó, bạn có thể đặt hướng dọc trong thông số Trang, lề, phông chữ, v.v.

Cách quét tài liệu và nhận dạng tài liệu đó trong MS Word

16.02.2018

Làm thế nào để tổ chức hợp lý việc di chuyển?

25.12.2017

Làm thế nào để cài đặt cửa sổ nhựa bằng tay của riêng bạn

06.09.2017

Có thể lấy phiên bản điện tử của tài liệu giấy bằng cách quét tài liệu đó. Định dạng của các tài liệu được quét có thể khác nhau, nhưng pdf được coi là phổ biến nhất. Các tệp được ghi ở định dạng này có thể dễ dàng mở bằng bất kỳ trình xem ảnh nào, nhưng không thể sửa đổi tài liệu kết quả. Quét tài liệu sang pdf có thể được thực hiện bằng cách sử dụng bất kỳ thiết bị văn phòng hoặc chuyên nghiệp nào được thiết kế để chuyển đổi các bản sao giấy sang dạng điện tử. Theo quy định, cài đặt mặc định của máy quét giả định rằng bản sao được lưu ở định dạng này. Tệp kết quả có kích thước nhỏ, có thể dễ dàng gửi qua e-mail, ghi vào ổ USB flash hoặc CD.

Kích thước tài liệu được quét pdf: lịch sử phát triển

Định dạng này xuất hiện lần đầu tiên vào năm 1993 và không được sử dụng rộng rãi ở giai đoạn đầu. Các chương trình có thể làm việc với tài liệu pdf đã được trả tiền, do đó việc phát triển thêm định dạng bị cản trở. Theo thời gian, các nền tảng để làm việc miễn phí với các tệp pdf đã xuất hiện và dần dần định dạng này đã đạt được sự công nhận và phân phối xứng đáng. Ngày nay định dạng pdf của các tài liệu được quét là phổ biến nhất trên thế giới.

Quét tài liệu sang Word: phải làm gì khi pdf không phù hợp

Tuy nhiên, không phải lúc nào việc quét tài liệu sang pdf cũng thuận tiện. Nếu bạn không chỉ cần nhận một bản sao điện tử của tài liệu để xem mà còn phải chỉnh sửa nó hoặc thực hiện các thay đổi và chỉnh sửa, thì định dạng này không phù hợp. Trong trường hợp này, việc quét tài liệu sang Word - một trình soạn thảo văn bản sẽ thuận tiện hơn nhiều, bạn có thể dễ dàng thực hiện tất cả các thao tác cần thiết với nguồn.

Bạn có thể nhận được phiên bản điện tử của tài liệu giấy có sẵn để chỉnh sửa trong hai giai đoạn:

  • quét tài liệu sang pdf,
  • sử dụng các chương trình đặc biệt để dịch tệp kết quả thành Word.

Phương pháp này là tối ưu và đơn giản, nó là người thường được sử dụng nhất ở các trung tâm sao chép khi có nhu cầu quét tài liệu sang Word .

Cách dịch một tài liệu từ chuyển PDF sang văn bản

Hiện nay, có một số dịch vụ trực tuyến để chuyển đổi một tài liệu từ pdf sang word, tuy nhiên, làm việc với chúng không phải lúc nào cũng thuận tiện, có những hạn chế về số lượng thao tác miễn phí và tỷ lệ lỗi trong nhận dạng văn bản cao.

Tùy chọn tốt nhất để dịch các tệp từ pdf sang word là phần mềm miễn phí tĩnh FineReader. Với sự trợ giúp của nó, bạn có thể dễ dàng chuyển đổi bất kỳ tệp được quét nào thành định dạng văn bản. Tuy nhiên, mặc dù thực tế là sản phẩm phần mềm này nhận dạng văn bản tốt, tài liệu kết quả phải được kiểm tra các lỗi có thể xảy ra.

Quét tài liệu định dạng lớn tại trung tâm sao chép

Tài liệu A4 có thể được chuyển đổi thành dạng điện tử với việc chuyển đổi sau đó sang định dạng doc bằng máy quét và máy tính văn phòng thông thường. Bản vẽ và tài liệu thiết kế chỉ có thể được quét bằng thiết bị đặc biệt trong trung tâm sao chép. Tại đây, bạn cũng có thể số hóa các bản vẽ, nhờ đó các tài liệu kỹ thuật được dịch sang định dạng có thể chỉnh sửa và cũng có thể thực hiện các thay đổi trong đó. Bạn nên liên hệ với trung tâm sao chép ngay cả đối với khối lượng lớn tài liệu quét có kích thước tiêu chuẩn A4. Các chuyên gia sẽ làm mọi thứ một cách nhanh chóng và không có sai sót.

Trước khi gửi tài liệu để quét đến trung tâm sao chụp, chúng phải được chuẩn bị: loại bỏ tất cả các kẹp giấy, lò xo và các vật lạ khác có thể cản trở quá trình quét. Nếu không có thời gian tự làm, bạn có thể đặt dịch vụ phù hợp tại các trung tâm sao chép.

Bạn không chỉ có thể quét tài liệu đen trắng mà còn có thể quét tài liệu màu. Đồng thời, chất lượng bản scan chuyên nghiệp sẽ luôn cao hơn so với bản scan sử dụng thiết bị văn phòng thông thường.

Tại trung tâm sao chép, khách hàng được sử dụng đầy đủ các dịch vụ in ấn và xử lý tài liệu ở bất kỳ định dạng nào.

Những người đang làm việc tích cực với các tài liệu và thông tin văn bản khác thấy rõ nhu cầu quét các tài liệu khác nhau. Điều quan trọng cần nhớ là sự hiện diện của máy quét hoàn toàn không được thảo luận để có được tài liệu chất lượng. Tuy nhiên, trong một số trường hợp nhất định, ảnh chụp văn bản được yêu cầu có thể hoạt động, nhưng ảnh cũng phải có chất lượng cao.

Cách quét tài liệu trong Word

  • Trước hết, tài liệu được quét. Đối với trường hợp này, tốt hơn hết bạn nên chọn định dạng png hoặc jpg. Kích thước của hình ảnh cũng phải ấn tượng (từ 400 dpi) để không có vấn đề về nhận dạng.
  • Các hình ảnh kết quả được lưu ở một vị trí cụ thể, sau đó bạn cần chính chương trình để nhận dạng văn bản. Tốt nhất là chọn Adobe FineReader. Đây là một phần mềm phổ thông không gây ra bất kỳ phàn nàn nào về chất lượng công việc của nó. Điều quan trọng cần lưu ý là sau khi cài đặt chương trình này, tab tương ứng sẽ xuất hiện trong MS Word, việc sử dụng chức năng được đơn giản hóa rất nhiều.
  • Thông qua Adobe FineReader, bạn cần chọn mục menu "Tệp" và "Mở", chọn những hình ảnh cần thiết. Tiếp theo, menu xử lý hình ảnh sẽ xuất hiện, chúng ta cần chọn ngôn ngữ được sử dụng trong tài liệu, cũng như một số tùy chọn khác, bao gồm từ điển và các cài đặt khác (không quá quan trọng để thu được kết quả).
  • Nhấn nút "Recognition" và đợi quá trình hoàn tất. Có khả năng không phải tất cả mọi thứ đều được nhận dạng, do đó, những từ mà chương trình không thể xác định được sẽ được tô màu khác, chúng có thể được chỉnh sửa trực tiếp trong chương trình.
  • Nếu bản thân văn bản trong tài liệu được quét hơi bị dịch chuyển, thì trong Adobe FineReader, bạn cần chọn một số đoạn văn bản nhất định bằng cách sử dụng lựa chọn. Điều này sẽ ngăn văn bản bị bỏ qua trong quá trình nhận dạng.
  • Do đó, bạn cần nhấp vào nút "Lưu", sau đó có thể chọn vị trí lưu tài liệu, cũng như định dạng của nó. Tất nhiên, trong trường hợp của MS Word, bạn cần chọn phần mở rộng doc hoặc docx.
  • Nếu trước khi lưu mà tài liệu bị tách thành nhiều cột thì bạn cần chọn menu "Định dạng", sau đó vào "Cột" và chọn "Một" để tài liệu trông đơn giản và hài hòa. Ngoài ra trong "Thông số trang" có khả năng tùy chỉnh lề, thụt lề và phông chữ.


Do đó, tài liệu có thể được chỉnh sửa miễn phí trực tiếp trong bộ MS Office. Điều quan trọng cần lưu ý là khi nhận dạng tài liệu trực tiếp trong Word, việc định dạng thậm chí còn dễ dàng hơn, vì chức năng giống nhau, cả đối với tài liệu gốc và tài liệu được nhận dạng.

Đối với việc nhận dạng từ ảnh hoặc các tài liệu khác, không dễ dàng như vậy để có được chất lượng nhận dạng cao, vì chúng ta đang nói về lề bù, thụt lề và các chi tiết khác của tài liệu, sẽ mất rất nhiều thời gian để sửa.