Có sự khác biệt nào giữa các định dạng âm thanh MP3, AAC, FLAC và bạn nên sử dụng định dạng nào? Vẽ một làn sóng từ tệp .wav.

Các định dạng tệp MP3 và WAV là một trong những định dạng phổ biến nhất được sử dụng cho ghi âm kỹ thuật sốâm thanh. Chúng giống nhau đến mức nào?

Sự thật về MP3

MP3- đó là đa phương tiện định dạng tập tin ghi âm. Nó được đặc trưng bởi tính linh hoạt tuyệt vời: nó được hỗ trợ bởi hầu hết tất cả các thiết bị hiện đại. hệ điều hành PC, thiết bị di động, nhiều thiết bị phát nhạc truyền thống - máy nghe nhạc MP3 và CD, máy ghi âm, hệ thống âm thanh nổi.

Định dạng MP3 được thiết kế để ghi lại dữ liệu âm thanh bằng cách nén - cố ý giảm chất lượng âm thanh để giảm kích thước tệp. Nhưng nếu việc tối ưu hóa dữ liệu âm thanh phù hợp được thực hiện một cách chính xác thì trong hầu hết các trường hợp, con người sẽ không nhận thấy được sự giảm chất lượng âm thanh.

Định dạng MP3 có lẽ là định dạng phổ biến nhất trong không gian trực tuyến. Nhưng ngay cả trước khi Internet trở nên phổ biến, các tệp âm thanh thuộc loại tương ứng đã khá phổ biến: chúng được đặt nhờ vào kích thước nhỏ, trên bộ nhớ flash của máy nghe nhạc MP3 hoặc trên đĩa ở số lượng lớn, thường hình thành bộ sưu tập chuyên đề bản ghi âm.

Sự thật về WAV

định dạng WAV cũng được sử dụng để ghi âm thanh kỹ thuật số. Nó không thua kém MP3 về tính linh hoạt và được hỗ trợ bởi các loại thiết bị hiện đại chính.

Ngược lại, định dạng này nhằm mục đích ghi dữ liệu âm thanh mà không cần nén. Do đó, các tệp WAV hầu như luôn có kích thước lớn hơn nhiều so với các tệp MP3 có nội dung tương tự. Về chất lượng, âm thanh WAV gần giống với bản gốc - miễn là nó được phát trên thiết bị công nghệ cao.

Định dạng WAV được yêu cầu chủ yếu trong lĩnh vực dịch vụ xử lý âm thanh chuyên nghiệp: dành cho phim, album phòng thu, trong ngành công nghiệp trò chơi - bất cứ nơi nào nó dự kiến ​​​​sẽ hoạt động. âm thanh chất lượng cao. Các tệp WAV cũng rất phổ biến đối với những người yêu thích âm nhạc, nhân tiện, trong hầu hết các trường hợp, họ rất dễ dàng xác định bằng tai sự khác biệt giữa các giai điệu được ghi trong MP3 và WAV.

So sánh

Vì vậy, sự khác biệt chính giữa MP3 và WAV là định dạng tệp đầu tiên liên quan đến việc ghi âm bằng nén. Đồng thời, nó có thể có mức độ khác nhau và “bitrate” (cường độ tái tạo luồng âm thanh). Ngược lại, điều này giống nhau đối với các tệp WAV trong mọi trường hợp.

Người ta tin rằng âm thanh không nén ở định dạng WAV có tốc độ bit khoảng 1400 Kbps. Chất lượng gần bằng âm thanh được ghi trên đĩa CD. Đổi lại, tốc độ bit của tệp MP3 có thể khác nhau: tối đa là 320 Kbps, tối thiểu là khoảng 8-16 Kbps. Theo quy luật, những giá trị thấp hơn sẽ cung cấp mức chất lượng âm thanh không thể chấp nhận được - một người khó có thể phân biệt được các nốt trong giai điệu được ghi ở tốc độ bit tương tự.

Kích thước tệp giữa tệp MP3 và WAV khác nhau như thế nào?

Ghi âm thanh sang MP3 với thời lượng 1 phút tại chất lượng tối đa- 320 Kbps - có dung lượng khoảng 2 megabyte. Theo đó, 1 phút phát âm thanh ở định dạng WAV sẽ tạo ra một file có dung lượng khoảng 9 megabyte.

Bàn

Vì vậy, bây giờ chúng ta biết sự khác biệt giữa MP3 và WAV. Chúng ta hãy ghi lại các tiêu chí chính xác định sự khác biệt tương ứng vào một bảng nhỏ.

Dữ liệu liên quan đến đa phương tiện (âm thanh, video, v.v.) được lưu trữ trong các tệp ở định dạng được gọi là RIFF (Định dạng tệp trao đổi tài nguyên). Cả tệp wav chứa tệp âm thanh và tệp avi chứa thông tin video đều ở định dạng RIFF.
Một tệp ở định dạng RIFF chứa các đoạn lồng nhau (đoạn). Đoạn bên ngoài bao gồm tiêu đề và vùng dữ liệu (Hình 1).

Cơm. 1. Đoạn "RIFF"

Đầu tiên từ kép tiêu đề chứa mã bốn chữ cái FOURCC, mã này xác định dữ liệu được lưu trữ trong đoạn. Từ kép thứ hai của tiêu đề là kích thước của vùng dữ liệu tính bằng byte (không bao gồm kích thước của chính tiêu đề).
Vùng dữ liệu có chiều dài thay đổi tuy nhiên, nó phải được căn chỉnh theo ranh giới từ và, nếu cần, được đệm bằng byte rỗng thành số nguyên từ.
Lưu ý rằng định dạng RIFF không mô tả định dạng dữ liệu. Trong thực tế, tệp RIFF có thể chứa bất kỳ loại dữ liệu đa phương tiện nào, với định dạng dữ liệu tùy thuộc vào loại dữ liệu.
Khu vực được chỉ ra trong hình. 1 dưới dạng “Dữ liệu”, có thể chứa các đoạn khác trong đó. Đối với tệp lưu trữ dữ liệu âm thanh (tệp wav), vùng này chứa mã định danh dữ liệu "WAVE", một đoạn có định dạng dữ liệu âm thanh "fmt" (ba ký tự "fmt" theo sau là khoảng trắng ở cuối) và một đoạn của dữ liệu âm thanh (Hình 2). Ngoài ra, tệp có thể chứa các đoạn thuộc loại khác, vì vậy bạn không nên cho rằng tiêu đề của tệp wav có định dạng cố định. Ví dụ: tệp có thể chứa đoạn "LIST" hoặc "INFO" chứa thông tin về quyền sao chép và các thông tin khác. Thông tin thêm. Chúng tôi sẽ không xem xét định dạng của các đoạn khác, nếu cần, bạn có thể tìm hiểu chúng từ tài liệu đi kèm; một phần của Microsoft SDK dành cho Windows.

DWORD

DWORD

"RIFF"

Kích cỡ

Dữ liệu
"SÓNG" "fmt" Kích cỡ Định dạng dữ liệu đoạn "dữ liệu"
"dữ liệu" Kích cỡ Dữ liệu âm thanh

Cơm. 2. định dạng tệp wav

Khu vực được chỉ ra trong hình. 2 là "Định dạng dữ liệu", mô tả dữ liệu âm thanh. Định dạng của vùng này dành cho các tệp PCM (được viết bằng cách sử dụng điều chế mã xung) tuân theo cấu trúc PCMWAVEFORMAT được xác định trong tệp mmsystem.h như sau:

Typedef struct pcinwaveformat_tag (
ĐỊNH DẠNG SÓNG wf;
WORD vBitsPerSample;
) PCMWAVEFORMAT;

Loạidef PCMWAVEFORMAT *PPCMWAVEFORMAT;

Cấu trúc WAVEFORMAT cũng được mô tả trong tệp mmsystem.h:

Typedef cấu trúc waveformat_tag (
WORD wFormatTag; // kiểu định dạng
WORD nKênh; // số kênh (mono hoặc stereo)
DWORD nSamplesPerSec; // tần số lấy mẫu
DWORD nAvgBytesPerSec; // tốc độ luồng dữ liệu
WORD nBlockAlign; // căn chỉnh khối dữ liệu
) ĐỊNH DẠNG SÓNG;

Typedef ĐỊNH DẠNG SÓNG *PWAVEFORMAT;

Trường wFormatTag mô tả loại định dạng dữ liệu âm thanh. Đối với PCM điều chế mã xung, được hỗ trợ thư viện chuẩn mmsystem.dll, trường này phải chứa giá trị WAVE_FORMAT_PCM được xác định trong tệp mmsystem.h:

#define WAVE_FORMAT_PCM 1

Trường nChannels chứa số lượng kênh. Nó có thể chứa giá trị 1 (mono) hoặc 2 (stereo).
Trường nSamplesPerSec chứa tần số lấy mẫu, tức là số lượng mẫu tín hiệu mỗi giây. Trường này có thể chứa giá trị tiêu chuẩn(11025 kHz, 22050 kHz hoặc 44100 kHz) hoặc các giá trị không chuẩn như 5000 kHz hoặc 4400 kHz. Xin lưu ý rằng không phải tất cả trình điều khiển bộ điều hợp âm thanh đều có thể
làm việc với tốc độ lấy mẫu không chuẩn.
Trường nAvgBytesPerSec chứa tốc độ dữ liệu trung bình, tức là số byte mỗi giây được gửi đến hoặc nhận từ trình điều khiển thiết bị. Thông tin này có thể được ứng dụng sử dụng để ước tính kích thước của bộ đệm cần thiết để chứa dữ liệu âm thanh. Đối với tín hiệu đơn âm có độ phân giải 8 bit, giá trị số của tốc độ trùng với giá trị của tần số lấy mẫu. Đối với tín hiệu âm thanh nổi có độ phân giải 8 bit, nó cao gấp đôi. Bạn có thể tính giá trị chính xác bằng công thức

NAvgBytesPerSec = (nChannels * nSamplesPerSec * wBitsPerSanipIe) / 8

Trường nBlockAlign chứa căn chỉnh khối theo byte, được tính bằng công thức

NBlockAlign = (nChannels * wBitsPerSample) / 8

Trường wBitsPerSainple được tìm thấy trong cấu trúc PCMWAVEFORMAT và chứa độ phân giải tín hiệu, nghĩa là số bit được sử dụng để biểu thị một mẫu tín hiệu. Thông thường giá trị được sử dụng là 8 hoặc 16.
Đối với định dạng của dữ liệu âm thanh, nó phụ thuộc vào số lượng kênh và độ rời rạc.
Đối với tín hiệu đơn âm có độ phân giải 8 bit, dữ liệu âm thanh là một mảng các giá trị một byte, mỗi giá trị là một mẫu của tín hiệu.
Đối với tín hiệu âm thanh nổi có độ phân giải 8 bit, dữ liệu âm thanh ở định dạng mảng các từ hai byte, với byte thấp của từ tương ứng với kênh bên trái và byte cao ở bên phải.
Định dạng dữ liệu âm thanh 16 bit trông tương tự. Đối với tín hiệu đơn âm, dữ liệu được lưu trữ trong một mảng các từ 16 bit. Đối với âm thanh nổi, một mảng các từ kép được sử dụng, với từ thấp nhất tương ứng với kênh bên trái và từ cao nhất tương ứng với kênh bên phải.
Phạm vi thay đổi giá trị mẫu tín hiệu được xác định bằng cách lấy mẫu. Đối với dữ liệu 8 bit, nó nằm trong khoảng từ 0 đến 255 (Oxff) và việc không có tín hiệu (hoàn toàn im lặng) tương ứng với giá trị 128 (0x80). Đối với dữ liệu 16 bit, phạm vi thay đổi là từ -32768 (-0x8000) đến 32767 (Ox7fff), việc không có tín hiệu tương ứng với giá trị 0.

Các tập tin âm thanh không nén trong định dạng thô(PCM) và ở định dạng WAV và Apple AIFF. Cấu trúc tệp RIFF và WAV.

Đọc thêm:
  1. II. Cấu trúc của Hệ thống chứng nhận GOST R và chức năng của những người tham gia
  2. PR trong các cơ quan, ban ngành nhà nước. PR trong lĩnh vực tài chính PR trong các tổ chức thương mại thuộc lĩnh vực xã hội (văn hóa, thể thao, giáo dục, y tế)
  3. Tài sản của cơ quan hải quan: khái niệm, cấu tạo và đặc điểm
  4. Phân tích tình hình tài chính của doanh nghiệp. Cơ cấu và thủ tục tạo ra kết quả tài chính.
  5. Dịch vụ hoạt hình, cấu trúc và vai trò của nó trong dịch vụ văn hóa - xã hội và du lịch.
  6. Bộ máy tòa án chuyên trách cấp cao: cơ cấu và đổi mới.

NGUYÊN- một định dạng dữ liệu chứa dữ liệu thô. Những tập tin như vậy chứa đầy đủ thông tin về tín hiệu được lưu trữ. Trong trường hợp xử lý âm thanh, RAW đề cập đến dữ liệu âm thanh không được nén và có tiêu đề.

PCM là viết tắt của điều chế mã xung và cung cấp một biểu diễn kỹ thuật số tín hiệu tương tự, được lấy mẫu (số hóa) theo định kỳ (với tần số được chỉ định bằng hertz) và được trình bày dưới dạng nhị phân(với độ chính xác nhất định - độ sâu bit). Ngoài việc sử dụng PCM cho âm thanh kỹ thuật số trên máy tính và trên đĩa CD âm thanh, định dạng này cũng được sử dụng trong một số kỹ thuật số hệ thống điện thoại và trong một số định dạng video kỹ thuật số.

Ở định dạng PCM, các giá trị biên độ âm thanh được biểu diễn bằng số khác nhau bit (độ sâu); nhạc phim, theo quy luật, được số hóa với độ sâu bit từ 12 đến 24 bit, nhưng thường xuyên nhất là khi phòng thu mã hóa âm thanh PCM để ghi trên Đĩa Blu-ray 16 bit được sử dụng.

WAV (SÓNG)- định dạng tệp chứa để lưu trữ bản ghi luồng âm thanh số hóa. Trong Windows, định dạng này thường được sử dụng làm trình bao bọc cho âm thanh không nén (PCM). Bạn có thể đặt âm thanh được nén với hầu hết mọi codec vào vùng chứa WAV (nhưng có thể gặp sự cố khi phát các tệp như vậy).

Cấu trúc: bao gồm ba tiêu đề, theo sau là dữ liệu tập tin âm thanh, I E. chuỗi byte của tín hiệu âm thanh.

Đầu tiên là tiêu đề RIFF. Nó chiếm 8 byte ngay từ đầu tệp và chứa thông tin về độ dài tệp

Tiêu đề thứ hai là tiêu đề WAV, chứa thông tin về số lượng kênh (mono hoặc stereo)

Tiêu đề thứ ba là thông tin về số byte được phân bổ cho chính dữ liệu WAV

Apple AIFF. Cái này định dạng chuẩn các tập tin để lưu dữ liệu âm thanh trên nền tảng Macintosh. Điểm đặc biệt của nó là cho phép bạn đặt thông tin bổ sung cùng với sóng âm thanh, đặc biệt là các mẫu WaveTable (ví dụ về âm thanh nhạc cụ cùng với các thông số của bộ tổng hợp), giúp cải thiện chất lượng của kết quả cuối cùng.

Dữ liệu âm thanh trong tập tin tiêu chuẩnĐịnh dạng AIFF không bị nén điều chế xung mã. Ngoài ra còn có một phiên bản nén của định dạng AIFF, được gọi là AIFC (đôi khi là AIFF-C), trong đó có thể sử dụng nhiều codec khác nhau để nén.



AIFF, cùng với SDII và WAV, là một trong những định dạng được sử dụng trong các ứng dụng âm thanh và video chuyên nghiệp, vì không giống như định dạng mp3 phổ biến hơn, âm thanh trong đó không bị giảm chất lượng.

RIFF- một trong các định dạng tệp chứa để lưu trữ dữ liệu đa phương tiện truyền phát (video, âm thanh, có thể là văn bản). Hầu hết định dạng đã biết sử dụng RIFF làm vùng chứa là: AVI (video), WAV (âm thanh), RMI (bản nhạc MIDI).

RIFF có giới hạn kích thước dữ liệu là 2 GB.

Tệp RIFF chứa các đoạn (khối) lồng nhau có dữ liệu cùng loại; Đoạn bên ngoài bao gồm tiêu đề và vùng dữ liệu.

Cấu trúc: Từ kép đầu tiên của tiêu đề xác định dữ liệu được lưu trữ trong đoạn. Từ kép thứ hai của tiêu đề là kích thước của vùng dữ liệu tính bằng byte (không bao gồm kích thước của chính tiêu đề).

Vùng dữ liệu có độ dài thay đổi nhưng phải được căn chỉnh theo ranh giới từ (kết thúc bằng byte rỗng nếu cần đối với số nguyên từ).

Chúng tôi xin giới thiệu với bạn một bài viết với phân tích chi tiết Tiêu đề tệp WAV và cấu trúc của nó.

Lý thuyết

Vì vậy, hãy nhìn vào cái phổ biến nhất tập tin WAV(Windows PCM). Nó đại diện cho hai khu vực được phân chia rõ ràng. Một trong số đó là tiêu đề tệp, cái còn lại là vùng dữ liệu. Tiêu đề tệp lưu trữ thông tin về:

  • Kích thước tập tin.
  • Số kênh.
  • Tần số lấy mẫu.
  • Số bit trong mẫu (giá trị này còn được gọi là độ sâu âm thanh).

Nhưng để hiểu rõ hơn về ý nghĩa của các đại lượng trong tiêu đề, chúng ta cũng nên nói về vùng dữ liệu và số hóa âm thanh. Âm thanh bao gồm các rung động, khi được số hóa sẽ có dạng từng bước. Loại này là do máy tính có thể tái tạo âm thanh có biên độ (âm lượng) nhất định trong bất kỳ khoảng thời gian ngắn nào và khoảnh khắc ngắn ngủi này không phải là ngắn vô hạn. Khoảng thời gian của khoảng thời gian này xác định tần số lấy mẫu. Ví dụ: chúng tôi có một tệp có tần số lấy mẫu là 44,1 kHz, có nghĩa là khoảng thời gian ngắn đó bằng 1/44100 của một giây (suy ra từ thứ nguyên của giá trị Hz = 1/s). Hiện đại card âm thanh hỗ trợ tốc độ lấy mẫu lên tới 192 kHz. Vì vậy, theo thời gian, chúng tôi đã tìm ra nó.

Bây giờ, về biên độ (âm lượng của âm thanh trong một khoảng thời gian ngắn). Tôi muốn nói rằng độ chính xác của âm thanh phụ thuộc vào nó. Biên độ được biểu thị bằng số chiếm trong bộ nhớ (tệp) 8, 16, 24, 32 bit (về mặt lý thuyết, có thể nhiều hơn). Như bạn đã biết, 8 bit = 1 byte, do đó, bất kỳ một biên độ nào trong một khoảng thời gian ngắn trong bộ nhớ (tệp) đều có thể chiếm tương ứng 1, 2, 3, 4 byte. Như vậy, hơn số lớn hơn chiếm dung lượng trong bộ nhớ (tệp), phạm vi giá trị của số này càng lớn và do đó đối với biên độ.

  • 1 byte – 0..255
  • 2 byte – 0..65 535
  • 3 byte – 0..16 777 216
  • 4 byte – 0..4 294 967 296

Ở phiên bản mono, các giá trị biên độ được sắp xếp tuần tự. Ví dụ: trong âm thanh nổi, đầu tiên là giá trị biên độ cho kênh bên trái, sau đó đến kênh bên phải, sau đó lại đến giá trị biên độ cho kênh bên trái, v.v.

Sự kết hợp giữa biên độ và khoảng thời gian ngắn được gọi là mẫu.

Bây giờ có một bảng hiển thị rõ ràng cấu trúc của tệp WAV.

Vị trí Cánh đồng Sự miêu tả
0..3 (4 byte) chunkId Chứa các ký tự “RIFF” trong mã hóa ASCII(0x52494646 trong biểu diễn big-endian). Đây là sự khởi đầu của chuỗi RIFF.
4..7 (4 byte) kích thước khối Đây là kích thước chuỗi còn lại từ vị trí này. Nói cách khác, kích thước tệp này là 8, nghĩa là các trường chunkId và chunkSize bị loại trừ.
8..11 (4 byte) định dạng Chứa các ký tự “WAVE” (0x57415645 trong biểu diễn big-endian)
12..15 (4 byte) subchunk1Id Chứa các ký tự “fmt” (0x666d7420 trong biểu diễn big-endian)
16..19 (4 byte) subchunk1Kích thước 16 cho định dạng PCM. Đây là kích thước còn lại của chuỗi con bắt đầu từ vị trí này.
20..21 (2 byte) định dạng âm thanh Định dạng âm thanh, danh sách đầy đủ có sẵn . Vì PCM= 1 (nghĩa là Lượng tử hóa tuyến tính). Các giá trị khác 1 cho biết một số định dạng nén.
22..23 (2 byte) số kênh Số kênh. Mono = 1, Âm thanh nổi = 2, v.v.
24..27 (4 byte) tỷ lệ mẫu Tần số lấy mẫu. 8000 Hz, 44100 Hz, v.v.
28..31 (4 byte) byteRate Số byte được truyền mỗi giây phát lại.
32..33 (2 byte) khốiCăn chỉnh Số byte cho một mẫu, bao gồm tất cả các kênh.
34..35 (2 byte) bitPerSample Số bit trong mẫu. Cái gọi là “độ sâu” hay độ chính xác của âm thanh. 8 bit, 16 bit, v.v.
36..39 (4 byte) subchunk2Id Chứa các ký tự “dữ liệu” (0x64617461 trong biểu diễn big-endian)
40..43 (4 byte) kích thước subchunk2 Số byte trong vùng dữ liệu.
44.. dữ liệu Dữ liệu WAV trực tiếp.

Đó là toàn bộ tiêu đề, độ dài của nó là 44 byte, theo sau là khối dữ liệu mà tôi đã mô tả ở trên.

Trên thực tế, rõ ràng là các kiểu dữ liệu được sử dụng có thể thay đổi được. Ví dụ: trong C (MSVS), bạn có thể sử dụng __int32 hoặc DWORD thay vì mảng char, nhưng sau đó so sánh với một số hằng chuỗi chẳng hạn, có thể không thuận tiện lắm. Tôi cũng muốn cảnh báo bạn về ảnh hưởng của xu hướng 64-bit mới trên phần mềm. Cụ thể: điều đáng ghi nhớ là trong ngôn ngữ C, kiểu biến int trên hệ thống 64 bit, nó sẽ dài 8 byte và trên hệ thống 32 bit, nó sẽ dài 4 byte. Trong những trường hợp như vậy, bạn có thể sử dụng loại biến nêu trên __int32 hoặc __int64, tùy thuộc vào kích thước của biến trong bộ nhớ mà bạn cần. Có các loại __int8 , __int16 , __int32 và __int64 , chúng chỉ có sẵn cho trình biên dịch MSVC++ ít nhất là phiên bản 7 ( Microsoft Visual Studio 2003.NET), nhưng bạn không thể sai lầm khi chọn kích thước kiểu dữ liệu.

Gần đây tôi nhận được lá thư sau:

Xin chào trang web, MP3 là định dạng âm thanh phổ biến nhất, nhưng có rất nhiều định dạng khác như AAC, FLAC, OGG và WMA nên tôi không thực sự chắc chắn mình nên sử dụng định dạng nào. Sự khác biệt giữa chúng là gì và tôi nên sử dụng cái nào để lưu trữ nhạc của mình?

Câu hỏi khá phổ biến, tôi sẽ cố gắng trả lời đơn giản nhưng rõ ràng.

Chúng ta đã nói về sự khác biệt giữa lossless và lossy, nhưng tóm lại, có hai loại chất lượng âm thanh:

  • không mất dữ liệu: FLAC, ALAC, WAV;
  • mất mát: MP3, AAC, OGG, WMA.

Lưu định dạng lossless đầy đủ chất lượng Trong hầu hết các trường hợp, âm thanh ở mức CD, trong khi định dạng lossy nén các tệp để tiết kiệm dung lượng (tất nhiên, chất lượng âm thanh sẽ giảm).

Các định dạng lưu trữ dữ liệu không nén: FLAC, ALAC, WAV và các định dạng khác

  • WAV và AIFF: Cả WAV và AIFF đều lưu trữ âm thanh không nén, có nghĩa là chúng bản sao chính xácâm thanh gốc. Hai định dạng về cơ bản có chất lượng như nhau; Họ chỉ lưu trữ dữ liệu hơi khác một chút. AIFF do Apple tạo ra nên bạn có thể thấy nó thường xuyên hơn ở sản phẩm của Apple và WAV khá phổ biến. Tuy nhiên, vì chúng không được nén nên chúng chiếm nhiều dung lượng không cần thiết. Nếu không chỉnh sửa âm thanh, bạn không cần lưu trữ âm thanh ở các định dạng này.
  • FLAC: Miễn phí Lossless Audio codec(FLAC) là định dạng lưu trữ âm thanh lossless phổ biến nhất nên đây là một lựa chọn tốt. Không giống như WAV và AIFF, nó nén dữ liệu một chút nên chiếm ít dung lượng hơn. Tuy nhiên, đây được coi là định dạng lưu trữ âm thanh lossless, chất lượng nhạc vẫn giữ nguyên như nguồn gốc nên sử dụng hiệu quả hơn WAV và AIFF. Nó là nguồn mở và miễn phí.
  • Táo lossless: Còn được gọi là ALAC, Apple Lossless tương tự như FLAC. Đây là định dạng nén nhẹ tuy nhiên nhạc sẽ được giữ nguyên mà không bị giảm chất lượng. Khả năng nén của nó không hiệu quả bằng FLAC, vì vậy các tệp của bạn có thể lớn hơn một chút nhưng nó được iTunes và iOS hỗ trợ đầy đủ (trong khi FLAC thì không). Vì vậy, nếu bạn sử dụng iTunes và iOS làm thiết bị chính phần mềmđể nghe nhạc, bạn sẽ phải sử dụng định dạng này.
  • A.P.E.: APE - có thuật toán nén mạnh mẽ nhất để lưu trữ nhạc lossless, nghĩa là bạn sẽ nhận được tiết kiệm tối đađịa điểm. Chất lượng âm thanh của nó tương đương với FLAC, ALAC nhưng thường có vấn đề về khả năng tương thích. Ngoài ra, việc phát định dạng này sẽ khiến bộ xử lý phải tải nhiều hơn để giải mã nó vì dữ liệu được nén ở mức độ cao. Nói chung, tôi không khuyên bạn nên sử dụng định dạng này trừ khi bạn bị hạn chế về giải phóng bộ nhớ và không gặp vấn đề về tương thích phần mềm.

Các định dạng lưu trữ âm thanh nén: MP3, AAC, OGG và các định dạng khác


Nếu bạn chỉ muốn nghe nhạc ngay bây giờ, rất có thể bạn sẽ sử dụng định dạng lossy. Chúng tiết kiệm rất nhiều bộ nhớ, giúp bạn có nhiều chỗ hơn cho các bài hát trên máy. máy nghe nhạc cầm tay và nếu đủ cao chúng sẽ không thể phân biệt được với nguồn ban đầu. Dưới đây là các định dạng bạn có thể gặp phải:

  • MP3: MPEG Audio Layer III, hay MP3, là định dạng lưu trữ âm thanh bị mất phổ biến nhất. Nhiều đến mức nó đã trở thành đồng nghĩa với âm nhạc có thể tải xuống. MP3 không phải là định dạng hiệu quả nhất nhưng chắc chắn là định dạng được hỗ trợ tốt nhất. lựa chọn tốt nhấtđể lưu trữ âm thanh nén.
  • A.A.C.: Trình độ cao Mã hóa âm thanh, còn được gọi là AAC, tương tự như MP3, mặc dù nó hiệu quả hơn một chút. Điều này có nghĩa là bạn có thể có các tệp chiếm ít dung lượng hơn nhưng có chất lượng âm thanh tương tự như MP3. Người truyền bá tốt nhất cho định dạng này hiện nay là iTunes của Apple, nó đã làm cho AAC trở nên phổ biến đến mức nó gần như được biết đến rộng rãi như MP3. Đối với rất trong một khoảng thời gian dài Tôi chỉ có một thiết bị không thể phát AAC và đó là cách đây vài năm, vì vậy bạn có thể sử dụng định dạng này một cách an toàn để lưu trữ nhạc của mình.
  • Ogg Vorbis : Định dạng Vorbis, được gọi là Ogg Vorbis do sử dụng bộ chứa Ogg, là thay thế miễn phí MP3 và AAC. Đặc điểm chính của nó là nó không chỉ giới hạn ở các bằng sáng chế mà còn cho bạn, với tư cách là một người dùng cuối, điều này không có tác dụng gì cả. Trên thực tế, mặc dù có tính mở và chất lượng tương tự nhưng nó kém phổ biến hơn nhiều so với MP3 và AAC, điều đó có nghĩa là có ít chương trình hỗ trợ nó hơn. Vì vậy, chúng tôi khuyên bạn không nên sử dụng nó để tránh các vấn đề về tương thích phần mềm.
  • WMA: cửa sổ truyền thông tinÂm thanh - mang thương hiệu riêng định dạng của Microsoft, tương tự như MP3 hoặc AAC. Nó không mang lại bất kỳ lợi thế nào so với các định dạng khác và nó cũng không được hỗ trợ tốt bên ngoài nền tảng Windows. Chúng tôi khuyên bạn không nên sao chép đĩa CD sang định dạng này trừ khi bạn biết chắc chắn rằng tất cả nhạc sẽ được phát trên đó. Nền tảng Windows hoặc trên các trình phát tương thích với định dạng này.

Vậy bạn nên sử dụng cái gì?

Bây giờ bạn đã hiểu sự khác biệt giữa từng định dạng, bạn nên sử dụng định dạng nào để trích xuất hoặc tải nhạc xuống? Nói chung, chúng tôi khuyên bạn nên sử dụng MP3 hoặc AAC. Chúng tương thích với hầu hết mọi người chơi và cả hai đều không thể phân biệt được với bản gốc, nếu . Trừ khi bạn có nhu cầu đặc biệt có yêu cầu khác, MP3 và AAC là lựa chọn tốt nhất cho bạn.

Tuy nhiên, có điều gì đó cần nói về việc lưu trữ nhạc của bạn ở định dạng lossless như FLAC. Trong khi có thể bạn sẽ không để ý nữa Chất lượng cao lossless rất tốt để lưu trữ nhạc nếu bạn dự định chuyển đổi nó sang các định dạng khác sau này, vì việc chuyển đổi định dạng lossless sang một định dạng lossless khác (chẳng hạn như AAC sang MP3) sẽ dẫn đến các tệp có dung lượng lớn hơn đáng kể. chất lượng thấp. Vì vậy, vì mục đích lưu trữ, chúng tôi khuyên dùng FLAC. Tuy nhiên, bạn có thể sử dụng bất kỳ định dạng lossless nào vì bạn có thể chuyển đổi giữa các định dạng lossless mà không làm thay đổi chất lượng của tệp.