Tất cả chúng ta sinh ra đều có thiên hướng âm nhạc, một khuynh hướng phát triển tự phát và được trau chuốt qua việc nghe nhạc. Gần như tất cả mọi người đều sở hữu các kỹ năng cảm thụ cần thiết để trải nghiệm và thưởng thức âm nhạc. Hãy nghĩ về “cảm âm tương đối”1 – khả năng nhận biết riêng rẽ một giai điệu tại cao độ hoặc nhịp độ chính xác khi nó được vang lên, và “nhận biết tiết tấu” (beat perception) – nghe thấy tính đều đặn trong một nhịp điệu. Ngay cả trẻ sơ sinh cũng tỏ ra nhạy cảm với âm điệu hoặc giai điệu, tiết tấu, và âm lượng của tiếng ồn trong môi trường xung quanh. Các lập luận dường như đều cho thấy rằng bản chất sinh học của con người đã được thiết kế để phù hợp cho cả việc nhận thức và thưởng thức âm nhạc.
Nhạc tính của con người (human musicality) rõ ràng rất đặc biệt. Nhạc tính là một tập hợp các đặc tính tự nhiên, phát triển tự phát dựa trên, hoặc bị thúc đẩy bởi, khả năng nhận thức (sự chú ý, trí nhớ, kỳ vọng) và thiên hướng sinh học của chúng ta. Nhưng điều gì khiến đặc điểm này đặc biệt? Có phải vì chúng ta dường như là loài động vật duy nhất có khả năng âm nhạc phong phú như vậy? Có phải thiên hướng âm nhạc của chúng ta là độc nhất vô nhị, giống như khả năng ngôn ngữ của chúng ta? Hay âm nhạc là một thứ gì đó có lịch sử tiến hóa dài đằng đẵng mà chúng ta cùng chia sẻ với những loài động vật khác?
Darwin cho rằng tất cả động vật có xương sống đều có khả năng nhận thức và thưởng thức nhịp điệu. giai điệu đơn giản vì chúng có các hệ thần kinh tương tự. Ông tin chắc rằng nhạc tính của con người có nền tảng sinh học. Darwin cũng cho rằng sự nhạy cảm về âm nhạc là một đặc tính cổ xưa, lâu đời hơn nhiều so với sự nhạy cảm về ngôn ngữ. Trên thực tế, ông xem nhạc tính là nguồn gốc của cả âm nhạc lẫn ngôn ngữ, và sự hiện diện của nó ở con người và động vật là do cơ chế tiến hóa của chọn lọc giới tính (sexual selection)2.
Thế nhưng, chúng ta chia sẻ khả năng này với các loài động vật khác đến mức độ nào? Nhạc tính có phải là một thứ gì đó độc nhất ở con người? Hay chúng ta chia sẻ nhạc tính với những động vật khác bởi vì “các hệ thần kinh [của chúng ta] cùng chung bản chất sinh lý,” như Darwin đã hoài nghi? Để hiểu được sự tiến hóa của âm nhạc và nhạc tính, chúng ta phải tìm ra âm nhạc gồm những thành phần nào và chúng bộc lộ sự hiện diện của mình ở động vật và con người ra sao. Có lẽ sau đó chúng ta mới có thể xác định liệu âm nhạc có đặc biệt với con người hay không.
Vào đầu thế kỷ 20, Ivan Pavlov phát hiện rằng những con chó có thể ghi nhớ một âm đơn và liên kết nó với thức ăn. Sói và chuột nhận biết đồng loại nhờ khả năng cảm âm tuyệt đối3 với tiếng kêu của chúng, và còn phân biệt được cả các giọng chính (tones). Chim sáo đá (starlings) và khỉ vàng (rhesus macaques) cũng biểu hiện những khả năng tương tự.
Dù vậy, một kỹ năng âm nhạc phức tạp hơn hẳn lại là cảm âm tương đối. Hầu hết mọi người không nghe từng giọng và tần số riêng rẽ của một bản nhạc mà nghe toàn bộ giai điệu. Dù bạn nghe “Mary Had a Little Lamb” ở một cao độ cao hơn hay thấp hơn, bạn vẫn nhận ra bài hát. Thậm chí, bạn còn có thể nhận ra nó ngay lập tức dù cho đoạn nhạc đang được phát ra từ một quán cà phê ồn ào.
Nhưng người hát là ai? Bạn vắt óc suy nghĩ, cố liên tưởng với hy vọng nhớ được tên ca sĩ hoặc tên bài hát. Khi nghĩ hoài không ra, bạn giơ smartphone về phía loa. Phần mềm sẽ cung cấp cho bạn toàn bộ thông tin mà bạn cần trong vòng vài giây. Giờ thì bạn biết chính xác bài hát nào được phát, ai đã hát, và nằm trong album nào.
Các loài chim hót sở hữu một hình thái lắng nghe khiến các nhà soạn nhạc hiện đại đặt âm sắc vào một vị trí quan trọng trong các sáng tác của họ.
Để làm được điều này, các nhà sản xuất phần mềm đã phân tích một cách có hệ thống và lưu trữ hiệu quả hầu hết các bản thu thương mại hiện hành. Một bản mô tả duy nhất cho mỗi bài hát, sử dụng hệ thống nhận dạng âm thanh (acoustic fingerprint)4, đã được nghiên cứu nhiều. Các nghiên cứu thần kinh học tiết lộ rằng cảm âm tương đối sử dụng một mạng lưới phức tạp các cơ chế thần kinh khác nhau, bao gồm các tương tác giữa vỏ não thính giác và vỏ não thùy đỉnh. Các loài chim hót dường như không có mạng lưới này. Trong nghiên cứu về nguồn gốc sinh học của nhạc tính ở người, sự thiếu vắng mạng lưới thần kinh này ở các loài chim hót khiến câu hỏi liệu con người có chia sẻ cảm âm tương đối với các loài động vật khác hay không thậm chí còn thu hút hơn trước.
Theo như ta biết, hầu hết các loài động vật không có cảm âm tương đối. Có vẻ như con người là ngoại lệ. Tuy nhiên, ai đó sẽ tự hỏi có phải cảm âm tương đối chỉ bị giới hạn dựa theo cao độ? Bên cạnh các thuộc tính vật lý đơn thuần của âm điệu, liệu mối liên hệ giữa các đặc tính này có góp phần tạo nên nhạc tính?
Năm 2016, các nhà nghiên cứu tại Đại học California, San Diego, đã có một đóng góp quan trọng trong việc đưa ra lời giải đáp hợp lý cho câu hỏi trên. Họ cho chim sáo đá tiếp xúc với các giai điệu khác nhau, với âm sắc và cao độ đã được tiền xử lý. Các kích thích bao gồm giai điệu âm sắc (sound-color melody), những chuỗi cung mà trong đó mỗi cung mang một âm sắc khác nhau. Một loạt thí nghiệm được thực hiện, nghiên cứu cách các loài chim sử dụng những đặc trưng về âm điệu để phân loại các giai điệu mới, chưa từng nghe trước đây.
Cá có thể phân biệt được các bản nhạc của John Lee Hooker và Johann Sebastian Bach.
Thật ngạc nhiên, các nhà nghiên cứu phát hiện ra rằng những con chim sáo đá không sử dụng cao độ để phân biệt một kích thích như theo suy đoán trước đây, mà nhờ âm sắc và các thay đổi trong âm sắc (đặc trưng âm phổ). Những con chim phản ứng với một bài hát ngay cả khi bài hát đã bị xử lý và toàn bộ thông tin cao độ bị loại bỏ bằng kỹ thuật “phát âm tiếng ồn” (noise vocoding). Giai điệu cuối cùng giống một chuỗi âm thanh ồn ào, một giai điệu âm sắc trong đó âm thanh thay đổi từ nốt này sang nốt khác nhưng không có cao độ rõ ràng. Khi chỉ còn lại chút ít thông tin, như các kích thích trong thí nghiệm với chim sáo đá Châu Âu của Hulse (các kích thích bao gồm các âm thuần, các âm không mang bất kỳ thông tin âm phổ nào), những con chim hót mới chú ý đến cao độ.
Đối với việc nhận biết giai điệu, các loài chim hót chủ yếu dựa vào thông tin âm phổ và cách chúng thay đổi qua thời gian, hay, cụ thể hơn, là sự thay đổi năng lượng âm phổ từ âm này sang âm khác. Ngược lại, con người tập trung lắng nghe cao độ và ít chú ý đến âm sắc.
Người ta có thể cho rằng những con chim hót đó lắng nghe giai điệu tương tự cách con người lắng nghe lời nói. Trong lối nói, con người tập trung chủ yếu vào thông tin âm phổ; đó là những thứ cho phép chúng ta phân biệt được từ “bath” (nhà tắm) và “bed” (phòng ngủ). Trong âm nhạc, giai điệu và nhịp điệu mới là thứ đáng quan tâm. Nếu cao độ – thứ có thể cho biết điều gì đó về bản sắc của người nói hoặc ý nghĩa cảm xúc của sự biểu đạt – chỉ là thứ yếu trong hành ngôn, thì trong âm nhạc, nó lại là chính yếu. Phân biệt tường tận giữa những trải nghiệm lắng nghe âm nhạc và lắng nghe lời nói là một chủ đề cực kỳ cuốn hút nhưng chưa được tìm hiểu sâu.
Một giải thích khả dĩ cho rằng nhạc tính là một sản phẩm phụ tạo bởi hệ thống vỏ não được phát triển cho lời nói và bị kích thích một cách khác thường bởi âm nhạc. Tuy nhiên, cũng có thể giải thích ngược lại, cụ thể là nhạc tính có trước cả ngôn ngữ và âm nhạc. Trong trường hợp đó, nhạc tính có thể được hiểu là sự nhạy cảm mà con người cùng chia sẻ với nhiều loài khác, nhưng ở người, khuynh hướng này đã tiến hóa thành hai hệ thống nhận thức chồng chéo một phần lên nhau: âm nhạc và ngôn ngữ.
Những bằng chứng thực nghiệm sơ khai ủng hộ ý tưởng này xuất hiện tại một hội nghị quốc tế vào năm 2014 ở Áo. Trong một bài diễn thuyết, Michelle Spierings, nghiên cứu sinh sau tiến sĩ tại Đại học Vienna, đã giải thích cách mà chim sẻ vằn xác định sự khác biệt giữa các chuỗi âm thanh. Michelle gọi chúng là “các âm tiết.” Các âm thanh bao gồm lời nói của con người như “mo”, “ca”, và “pu.” Thứ tự của những âm nói này (cú pháp), cũng như cao độ, thời lượng và dải âm lượng (đặc trưng âm phổ), được thay đổi trong suốt một loạt các thí nghiệm hành vi khác nhau.
Đầu tiên, chim sẻ vằn nhận biết sự khác biệt giữa chuỗi Xyxy và xxyY, trong đó x và y đại diện cho những âm nói khác nhau, và chữ in hoa đại diện cho một trọng âm mang tính nhạc: cao hơn, dài hơn hoặc lớn hơn. Ví dụ: “MO-ca-mo-ca” khác với “mo-mo-ca-CA.”
Tiếp đó, chim sẻ vằn sẽ lắng nghe một chuỗi lạ, với các trọng âm và cấu trúc khác nhau. Mục đích là để kiểm tra khía cạnh nào trong âm thanh nói được các loài chim sử dụng để phân biệt: trọng âm mang tính nhạc hay trình tự của các yếu tố.
Như Michelle cho thấy, con người có sự phân biệt này chủ yếu dựa trên trình tự của các yếu tố: abab khác với aabb, trong khi cdcd giống abab. Con người “khái quát hóa” cấu trúc của abab cho chuỗi cdcd chưa từng nghe thấy trước đó. Điều này củng cố ý tưởng rằng con người tập trung chủ yếu vào cú pháp, hay trình tự của các yếu tố, khi nghe một chuỗi như vậy. Cú pháp (trình tự từ, chẳng hạn như “man bites dog” (người đàn ông cắn con chó)) tạo thành một đặc điểm quan trọng của ngôn ngữ.
Trái lại, chim sẻ vằn hóa ra chỉ tập trung chủ yếu vào các khía cạnh âm nhạc của các chuỗi. Điều này không có nghĩa là chúng không nhạy cảm với trình tự (trên thực tế, chúng có thể hiểu nó ở một mức độ nào đó), nhưng sự khác biệt về cao độ (ngữ điệu), thời lượng, và thay đổi trọng âm – ngôn điệu mang tính nhạc (musical prosody) – mới là phương thức chủ yếu được chúng sử dụng để phân biệt các chuỗi.
Kết quả hàm ý rằng con người có thể cùng chia sẻ một hình thái nghe nhạc với chim sẻ vằn, một hình thái mà trong đó sự chú ý được tập trung vào các khía cạnh âm nhạc của âm thanh (ngôn điệu mang tính nhạc), chứ không phải theo cú pháp và ngữ nghĩa như trong lối nói.
Đến đây, quan điểm của Darwin một lần nữa được bàn tới. Liệu quá trình nghe nhạc của con người và chim sẻ vằn có liên hệ mật thiết?
Nghiên cứu về chim sáo đá và chim sẻ vằn tiết lộ rằng các loài chim hót sử dụng toàn bộ âm phổ để thu thập thông tin. Chúng dường như có khả năng nghe “tương đối,” dựa trên các đặc trưng về âm sắc, ngữ điệu và dải âm lượng. Đây là một hình thái nghe đã được các nhà lý luận âm nhạc quan sát trước đó và khiến các nhà soạn nhạc hiện đại như Edgard Varèse, Gyorgy Ligeti và Kaija Saariaho đặt âm sắc vào một vị trí quan trọng trong các sáng tác của họ.
Cảm âm tương đối ở người có thể mang nhiều ý nghĩa hơn chứ không chỉ là sự chênh lệch về cao độ. Những giai điệu quen thuộc đã bị biến đổi cao độ đến mức không thể nhận ra vẫn có thể nhận biết được từ những đặc trưng âm điệu khác. Nhưng con người hiếm khi quan tâm đến các đặc trưng âm phổ.
Toàn bộ điều này gợi lên những câu hỏi: Cần điều gì để một con người có thể nghe được như một con chim hót? Hoặc, ngược lại, một con chim hót có thể nghe nhạc theo cách của con người được không?
Con người và các loài chim hót có những chiến lược và những ưu tiên riêng khi lắng nghe. Một nghiên cứu riêng về chim sẻ vằn nhận thấy cấu trúc nhịp điệu không phải là điều đầu tiên mà chim sẻ vằn chú ý đến. Bằng chứng dường như cho thấy rằng chim sẻ vằn tập trung chủ yếu vào ngữ điệu, âm sắc, sự khác biệt âm lượng và ít chú ý đến khía cạnh thời lượng của âm thanh. Trên thực tế, ngôn điệu mang tính nhạc có thể mang lại nhiều thông tin cho chim sẻ vằn hơn là cấu trúc biến đổi theo thời gian của tiếng nhạc.
Kết quả của nghiên cứu về chim sẻ vằn buộc ta phải nhận ra rằng những gì rõ ràng với con người không nhất thiết rõ ràng với động vật. Trong khi chúng ta không thể ngừng nghe thấy tính đều đặn trong những nhịp điệu đều đều, chim sẻ vằn dường như tập trung chủ yếu vào các khía cạnh “cục bộ” khác, như một âm đơn hoặc thời lượng. Điều này làm sáng tỏ một câu đùa của nhà tâm lý học người Mỹ James J. Gibson: “Sự kiện có thể nhận thấy được nhưng thời gian thì không.” Chỉ có thể nhận thức được thời gian khi có điều gì đó xảy ra. Trong trường hợp của chim sẻ vằn, “sự kiện” này có vẻ như là những âm thanh riêng lẻ được chúng gán cho một số đặc điểm nhất định và không mang quá nhiều cấu trúc thời lượng trong một chuỗi âm thanh (nhịp điệu mà trong đó các âm thanh nối theo nhau).
Theo cách hiểu này, con người lắng nghe một cách tổng quan và trừu tượng hơn, với sự tập trung tới tổng thể. Chúng ta gần như quá giỏi trong việc nhìn và nghe các mối liên hệ, những mối liên hệ vốn thường không có thực mà xuất phát từ những trải nghiệm và kỳ vọng của chính chúng ta. Đây là lý do tại sao chúng ta thấy ngạc nhiên khi các động vật khác giải quyết vấn đề theo những cách có vẻ phức tạp hơn nhiều so với con người. Tuy nhiên, giải pháp đơn giản nhất đối với chúng ta không phải lúc nào cũng là giải pháp đơn giản nhất cho các loài động vật khác.
Hãy xem xét ví dụ về một giải pháp đơn giản đến bất ngờ cho một vấn đề trực quan: phát triển một thuật toán tìm kiếm có thể tìm thấy hình ảnh của máy bay trên Internet. Đây là một việc khó khăn vì nhiều trong vô số những bức ảnh phù hợp có hình ảnh của các vật thể gần giống với máy bay, như chim hoặc các vật thể màu trắng hoặc kim loại trên nền xanh.
Phương pháp kinh điển trong trí tuệ nhân tạo sẽ là tạo ra một hệ thống dựa trên kiến thức, mã hóa các quy tắc tỉ mỉ (máy tính có thể hiểu được) về những gì cấu thành và không cấu thành nên máy bay. Danh sách này có thể khá dài: một vật thể dài và đối xứng, hai cánh, mũi và đuôi, cửa sổ nhỏ dọc theo hai bên, cánh quạt trên mũi hoặc mỗi cánh, v.v. Việc lập một danh sách các tiêu chuẩn tương thích với mọi loại máy bay là vô cùng thử thách, nhưng điều đó cũng có thể giúp phân biệt được máy bay với, chẳng hạn như, chim và các vật thể khác giống như máy bay.
Đưa smartphone của bạn đến gần ai đó đang hát cùng một bài hát, và phần mềm sẽ chẳng đoán được bài gì đang được hát.
Các mô phỏng máy tính gần đây chứng minh một cách thuyết phục rằng phương pháp hiệu quả nhất để xác định một vật thể trong ảnh có phải là máy bay hay không, thật đáng ngạc nhiên, không hề sử dụng một hệ thống dựa trên kiến thức. Mọi suy luận phức tạp hóa ra là thừa. Câu hỏi – có hay không có máy bay trong bức ảnh? – có thể được giải đáp đơn giản và hiệu quả hơn bằng cách chỉ tập trung vào một chi tiết duy nhất: Có hay không có bánh xe càng mũi trong bức ảnh?
Chim sẻ vằn và các động vật khác tham gia thường xuyên vào các thí nghiệm phân loại có lẽ có thể làm được điều đó. Có thể nói, chúng lắng nghe “chiếc bánh xe càng mũi” của âm nhạc: một chi tiết ít liên quan đến bản chất của âm nhạc. Con chim ghi nhớ và nhận biết một chi tiết đặc trưng, một chi tiết dẫn đến thức ăn thường đủ xứng đáng để con chim tiếp tục tập trung vào đó.
Những gì chúng ta biết chắc chắn là con người, các loài chim hót, chim bồ câu, chuột và một số loài cá (như cá vàng và cá chép) có thể dễ dàng phân biệt được các giai điệu khác nhau. Tuy nhiên, vẫn còn nhiều nghi vấn về việc liệu chúng có làm theo cách giống như con người hay không, tức là, bằng cách lắng nghe các đặc điểm cấu trúc của âm nhạc.
Một nghiên cứu ở Bắc Mỹ sử dụng cá chép koi – một loài cá, giống cá vàng, nghe tốt hơn hầu hết các loài cá khác – đã đưa ra một ví dụ khác thường. Cá chép thường được gọi là “chuyên gia thính giác” vì thính giác tốt của chúng. Độ nhạy thính giác của cá chép có thể so với việc nghe thấy âm thanh qua đường dây điện thoại: Dù khả năng có thể bị hạn chế ở dải cao hơn và thấp hơn nhưng cá chép có thể nghe rõ hầu hết các âm thanh.
Ba con cá chép koi – Beauty, Oro và Pepi – được đặt trong một bể cá tại Học viện Rowland thuộc Đại học Harvard, nơi chúng từng tham gia vào một loạt những thí nghiệm nghe khác. Trong các thí nghiệm trước đó, chúng hiểu rằng chúng sẽ nhận được thức ăn nếu nhấn vào một cái nút ở đáy bể, nhưng chỉ khi nghe thấy tiếng nhạc cùng lúc đó. Thí nghiệm hiện tại tập trung vào khả năng phân biệt âm nhạc của cá chép. Cùng với việc được huấn luyện để phân biệt giữa hai bản nhạc (khả năng phân biệt), Beauty, Oro và Pepi đã được quan sát để xem liệu chúng có thể nhận ra những bản nhạc lạ có giống với các tác phẩm khác hay không (khả năng phân loại).
Trong thí nghiệm phân biệt, cá koi được tiếp xúc với các bản nhạc của Johann Sebastian Bach và ca sĩ nhạc blues John Lee Hooker để xem liệu chúng có thể phân biệt được các tác phẩm giữa hai người hay không. Ở thí nghiệm phân loại, cá koi được thử nghiệm để xem liệu chúng có thể phân loại một bản nhạc thuộc thể loại nhạc blues hay nhạc cổ điển. Trong hoạt động này, chúng lần lượt tiếp xúc với những bản thu âm của các ca sĩ nhạc blues và các nhà soạn nhạc cổ điển khác nhau, từ Vivaldi đến Schubert.
Kết quả đáng ngạc nhiên là cả ba con cá koi đều có thể phân biệt không chỉ giữa các tác phẩm của John Lee Hooker và Bach, mà còn giữa các thể loại nhạc blues và cổ điển nói chung. Dường như cá có thể khái quát hóa, để phân loại chính xác một bản nhạc mới, bản nhạc chưa từng nghe dựa trên sự khác biệt đã học được.
Nhưng quyết định của những con cá koi dựa trên nền tảng gì? Làm thế nào mà chúng phân biệt được? Và chính xác thì chúng nghe thấy những gì? Nếu không có gì khác, nghiên cứu đã cho thấy rõ chúng không phân biệt dựa trên âm sắc của âm nhạc, bởi vì ngay cả khi giai điệu cổ điển và blues được chơi trên một nhạc cụ có âm sắc khác, cá koi vẫn có thể phân biệt được chúng.
Nghiên cứu về cá koi được lấy cảm hứng từ một nghiên cứu vào năm 1984 mô tả khả năng phân biệt âm nhạc của chim bồ câu đá. Hóa ra chim bồ câu đá cũng có thể phân biệt các tác phẩm của Bach và Stravinsky. Và, giống như cá chép, chim bồ câu đá cũng có thể khái quát những gì chúng đã học được chỉ từ hai bản nhạc với những bản nhạc lạ lẫm khác. Chúng thậm chí có thể phân biệt được các sáng tác của những người đương thời với Bach và Stravinsky.
Chim bồ câu đá và cá chép có thể làm được một điều gì đó khá khó nhằn đối với một con người bình thường: đánh giá một bản nhạc được sáng tác vào thời của Bach (thế kỷ 18) hay Stravinsky (thế kỷ 20). Hơn nữa, các loài này có thể làm tất cả những điều này khi không có quá nhiều trải nghiệm nghe, không có bộ sưu tập âm nhạc phong phú, và cũng không thường xuyên tham dự các buổi hòa nhạc. Có nghi vấn rằng chúng thực hiện việc này dựa trên một chi tiết đặc trưng. Điều này, tự nó, là một đặc tính đặc biệt. Nhiều khả năng đây là một chiến thuật thành công nhằm mang lại thức ăn. Tuy nhiên, nó vẫn chưa cung cấp một cái nhìn sâu sắc về “nhận thức, thậm chí là thưởng thức,” âm nhạc. Đó có thể là một khía cạnh của nhạc tính chỉ thuộc về con người.
Cảm âm tương đối (relative pitch): Khả năng nhận biết nốt nhạc bằng cách so sánh nó với nốt nhạc tham khảo.↩
lọc giới tính (sexual selection): Là phương thức riêng biệt của chọn lọc tự nhiên trong quá trình lựa chọn bạn tình của động vật để giao phối, do Charles Darwin đưa ra vào khoảng năm 1871↩
Cảm âm tuyệt đối (perfect pitch/absolute pitch): Khả năng nhận biết nốt nhạc hoặc cao độ của nốt nhạc mà không cần nốt tham khảo.↩
Hệ thống nhận dạng âm thanh (acoustic fingerprint): Hệ thống với những bản thu kỹ thuật số chắt lọc từ những tín hiệu âm thanh, được sử dụng để xác định mẫu âm thanh hoặc nhanh chóng định vị các bản thu tương tự trong cơ sở dữ liệu âm thanh.[/foot để cho thông tin về chất âm của từng bản nhạc, được lưu trữ trong một kho dữ liệu khổng lồ. Sau đó, chương trình máy tính so sánh bản ghi của bản nhạc được thu từ smartphone với bản thu trong kho lưu trữ để nhận diện bản ghi âm một cách nhanh chóng và hiệu quả. Trong khi máy vi tính xử lý việc này dễ như trở bàn tay, con người lại gần như không thể làm được.
Tuy nhiên, nếu bạn đưa smartphone của mình đến gần một người khác đang hát lại bài hát này, phần mềm sẽ phản hồi nó không nhận diện được bài hát . Hoặc nó sẽ đoán bừa. Phiên bản của bản nhạc được hát không hề có trong kho dữ liệu âm nhạc đã được phân tích, vì vậy phần mềm không thể tìm thấy bản ghi. Ngược lại, con người ở trong tình huống tương tự sẽ nhận ra bài hát ngay lập tức, và bài hát thậm chí có thể còn vang vọng trong tâm trí họ nhiều ngày sắp tới.
Có thể nói, máy vi tính sẽ rất ngạc nhiên khi biết chúng ta chỉ cần một nửa bài hát để xác định ai hay bài gì đang được cất lên, bất kể nó được hát ở cao độ cao hơn hay thấp hơn, chậm hơn hay nhanh hơn, đúng tông hay lệch tông. Đối với con người, cảm giác tận hưởng khi nghe nhạc bắt nguồn một phần từ các mối liên kết và liên hệ thính giác (cả về giai điệu lẫn hòa âm) giữa các âm.
Trong một khoảng thời gian dài, các nhà khoa học tin rằng các loài chim hót nhận biết và ghi nhớ các giai điệu theo cao độ hoặc tần số âm cơ bản[footnote]Tần số âm cơ bản (fundamental frequency): Là cao độ của một nốt nhạc mà con người có thể nghe thấy được.[/, kỹ năng này là một hình thái cảm âm tuyệt đối. Nhà nghiên cứu chim người Mỹ Stewart Hulse đã đi đến kết luận này cách đây khoảng 40 năm sau khi thực hiện một loạt các thí nghiệm lắng nghe với chim sáo đá Châu Âu. Ông chỉ ra rằng những con chim sáo đá có thể phân biệt giữa các chuỗi cung (tone sequence) tăng dần và giảm dần, nhưng không thể phân biệt được nếu các chuỗi được chơi ở cao độ cao hơn hay thấp hơn một chút. Hulse kết luận rằng những con chim tập trung vào tần số tuyệt đối. Chim sáo đá Châu Âu, giống như nhiều loài động vật có vú, hóa ra có cảm âm tuyệt đối thay vì cảm âm tương đối.
Cảm âm tương đối ở con người, hay khả năng nhận biết các giai điệu được dịch giọng[footnote]Dịch giọng: Chơi hoặc chép nhạc sang một giọng (tone) khác nhưng vẫn giữ nguyên giai điệu.↩