Ses isleme: DSP Bit / KHZ / ADC-DAC nedir... (+ PDM/PWN/DSD)

Oncelikle bu yazidaki bilgiler kisisel bilgilerim olup hatalar icerebilir, bunlari gordugunuzde bildirirseniz memnuniyetle duzeltirim.

Aslinda Digital ses diye birsey yok, digital veri var ve onun da bir siniri yok 🙂
ADC adi verilen donusturuculer ( Analog to Digital Converter ) Ses sinyallerini isler, tanimlar ve I/0 degerlerine donusturur.
Bu yonuyle tipki AG baglantisi sistemine benzer.

Sesteki Bit degerlerini ve hz/khz degerlerini isterseniz kisaca anlatayim boylece AMP ne ise yarar daha iyi anlariz.

2 cesit BIT degeri vardir, birisi derinlik iken digeri ornekleme birimidir (BITRATE).
Ornekleme araligi icin once MP3 gibi sıkıştırılmış formatlari anlatarak baslayayim...
Bunlar aslinda bir arsiv dosyasidir ama ZIP dosyasi gibi icerisinden digitallestirilmis ses cikmaz, aksine her "sn" icin bir bit degeri verilir ve ses dosyasi o araliga gore kaydedilir, tabi birbirlerine benzerlik gosteren sinyaller yok edilerek yapildigi icin yer kazanilmis olur.
Mesela 128 kbps degerindeki bir MP3 dosyasi 1 saniye icin 128 KiloBit veri saklayabilir.

MP3 gibi formatlarda sinyal derinligi olmadigindan 16/24 BIT gibi degerler bulunmaz.
Bu degerleri decoding islemi esnasinda sahip oldugunuz DAC belirler, ama kayipli formatlar 16 BIT olarak sabit sekilde decode edildiginden anlatacak fazla bir konusu yok.

Digital ses turune ise PCM denmekte olup farkli formatlarda saklanabilir, "vaw", "AIFF", "M2TS" gibi...
Acilimi ise Pulse-Code-Modulation'dur, tanimlarsak...
Ses dedigimiz bir dalga titresimidir, bu titresimleri yakalamak icin bir aralik belirlenmistir.
En dusuk aralik 20 hz iken en yuksek aralik PCM icin 192 (384 de mevcut ama PCM de kullanilmaz) khz'dir...
20 hz demek saniyede 20 defa titresim demek iken 192 Khz demek saniyede tam 192 bin defa titresim demektir...
Yalniz bu dalga titresimidir ama tek basina titresim ses icin bir anlam ifade etmez, burada bir cok ek faktor varken Decibel denilen (ses) titresim siddeti birimi bunun seviye belirleyici olanidir.
Decibel ismi, mucidi olan Graham Bell'den gelmektedir, birimin adi Bell idi ama olculebilirlik acisindan 10 luk sistem kullanilmasi gerektiginden Decibel olarak kabul edilmistir.
Yani dalga siddeti hz ile degil DB ile olculur...

Konuya donersek...
Kaynak titresim araligi belki 1000 hz dir ama kaynak siddeti dusuk ise duyulmasi cok zor olabilir keza kaynak yuksek olur ama frekans dusuktur bu seferde anlamsiz gurultuler duyarsiniz...
Ses siddeti degerini kaynak gucu belirler, sesin kalitesini de frekans araligi belirler.
Tipki FPS gibi dusunebilirsiniz bunu 🙂
120*120 pixel bir goruntu 20 bin FPS bile olsa sizin icin pek bir anlam ifade etmez...
Bu konuyu (AMP) yazinin sonunda tamamlayacagim.

Bit ve Hz degerlerine donecek olursak.
Dijital ses icin BIT demek palet araligi demektir, yani nasil bir resim dosyasinda renk derinligi icin palet araligi var ise ses icin de ayni sey gecerlidir.
Orneklenen bir ses dalgasinin en alt ve ust ses degerleri icin bir palet hazirlanir ve butun islem bu paletteki derinlik sinirlari icinde gerceklestirilir.
Basitlestirirsek,
Tipki renk tonlari gibi ses derinligi icin de tonlar mevcuttur ve bunu dijitallestirebilmek icin bir aralik belirlenir, iste bu palet bu araligi temsil eder.
Ve ses islemcisi 1 seferde bu palet genisliginde veriyi isleyebilir, bu yonuyle bildigimiz islemci mantigi gecerlidir...
Ama islemciden ayiran kisim islenen verinin devasa boyutlara ulasabilmesidir...
Orneklersek...
192 khz ses cok yuksek bir tondur ve genis bir spectrumu vardir bu kadar buyuk bir ton degerini isaretleyebilmek icin yine cok buyuk rakamlar gereklidir.
Fakat teknoloji ve islem gucunun gelismesi once 24 Bit daha sonra da 32 Bit ses islemcilerinin onunu acmis, dolayisiyla inanilmaz DB ve Frekans degerlerine ulasilmistir.

8 bit bir ses dosyasi, 2 uzeri 8 yani 256 sayisal deger alabilirken 16 Bit'te bu 65.536, 24 Bit icin 16.777.216, 32 bit icin ise 4.294.967.296 rakamlarina tekabul eder.

Yine burada SNR de onemlidir.
SNR, Sesin arkaplan gurultusunden ayrildigi sinira denmektedir...

Ses'in gurultuden ayrilmasi icin siddetinin yuksek olmasi gereklidir ama veri alani darligi burada limitleyici etkendir bu yuzden 8 Bit icin SNR (Signal To Noise Ratio) 24DB ile sinirliyken 32 Bit icin bu deger tam 144DB'dir.
192 Khz 32 bit ses dijital veri olarak devasa kapasitelere denk gelir...
32 Bit 144DB bir kayit ozellikle muzik icin neredeyse sesin butun tonlarini kaydedebilir.
Bunu anlatmak icin PCM de bu islemin nasil gerceklestigini anlatayim kisaca...

8 Bit @ 20 hz bir ses dosyasi 8x20 =16bps
8 bit @ 20 khz ses dosyasi 8x20000 = 16000bps = 15Kbps
16 bit @ 20z = 16x20 = 32bps
16 bit @ 20 khz = 16x20000 = 320000bps = 312Kbps
32 bit @ 44khz = 32x44000 = 1408000bps = 1375Kbps
32 bit @ 192khz = 32x192000 = 6144000bps = 6000Kbps

Yani 2 saatlik bir Hi-Res audio blu-ray filmi 32 Bit / 192 Khz olursa: 120*60= 7200sn, 7200*6000 = 43200000KB / 42000MB / 42GB tekabul eder...
Sadece 3 dk muzik dosyasi neredeyse 1024MB olmaktadir 🙂

Daha once MP3 dosyalarinin BIT Depth degerinin olmadigini belirtmistim, bunun sebebi MP3 dosyalarinin PCM dosyalarindaki verilerin salt olarak islenmis ve sıkıştırılmış halidir.
PCM kayitlari verileri ayna gibi birebir saklarken MP3 gibi dosya formatlari ihtiyac olmadigi dusunulen ses tonlarini, benzerlik tasiyan tonlari, hatta araliktaki dusuk tonlari bile filtreler.
Bunlar genelde Yuksek tonlardir, bu yuzden MP3 Bitrate ne kadar yuksek olursa filtrelenen ses o kadar azalirken icerigin kalitesi de yukselir.
Fakat bu formatin Bitrate'i ne olursa olsun PCM formatinda ses vermesi imkansizdir, ton paleti bulundurmadigindan hangi tonlarin kaybedilecegine karar verilemez.
Yani yaklasik CD kalitesine denk gelen 512Kbps bir MP3 dosyaniz bile olsa seste kayiplar olacaktir.
Bu yuzden Losless denilen alternatif kodlayicilar cikmistir...
Bu kodlayicilarin MP3 gibi format'lardan farki kendilerini PCM ye benzetmeleridir.
Burada degisen sey ise yukarida belirttigim bit derinligi sistemidir.
Ornek olarak FLAC dosyalari 1hz 65khz arasi 32bit derinliginde sabit bir palet kullanir.
Kayipsiz dense de yine bir kayip vardir ama kayit araligi yuksek oldugu icin duyulabilecek seslerin kaybedilmeyecegi varsayildigindan kayipsiz sayilmaktadir.

FLAC turundeki kayitlarin orjinal kaynaklari PCM olmadigi surece hic bir anlami yoktur, MP3 gibi formatlardan geri donusturmek bosuna bir caba olacaktir 🙂

Son olarak su bilgiyi de ekleyeyim ki AMP ile dogrudan alakali.
Normal bir insan 20hz 20khz arasindaki sesleri dogal halleri ile duyabilecek kapasitededir. Oyleyse bu devasa KHZ birimleri ne anlam ifade ediyor...
Oyle ya, madem duyamayacaksak bu frekanslardan bize ne...
Mi acaba? 😀

Iste burada AMP devreye girmektedir. Amp yani amplifier, Turkce de AMFI olarak gecmektedir. Duyulmasi zor olan yuksek frekanslarin siddetini artirarak duyulabilecek hale getirir yani cok ciliz olan bir ses uygun bir ses siddeti ve filtrelemesi ile bant degistirip duyulabilecek bir hale gelir ki bu da...

DAC'tan alinan analog ses yukseltilerek yapilir.
Kaynak sesin elektron degerini yukselterek sesin dalga siddetini artirir, yani aslinda sinyalleri elektrikle yukler bu yonuyle WiFi router'larin yaptigi isi yapar diyebiliriz...
Ama bu cok karmasik bir istir ve bir cok filtreden gecmektedir, fakat bunlari anlatmak sayfalar dolusu yazmayi gerektirdiginden pas gececegim 🙂

Tabi AMP'in etkili olabilmesi icin sinyal haline gelen sesin dalga haline donusturulmesinde kullanilan birimin yani Hoparlor, Kulaklik kalitesi de bunu belirler.
DB araligi, OHM Direnci vs...
Iste Hi-Res kulakliklar da bu frekans hassasliklarina uygun bir yapi bulunur.

Ekleme:
ADC ve DSP konusunu cok hizli gectigimi fark ettigimden onlari da ekleme ihtiyaci duydum.

DAC/ADC : Digital to Analog / Analog to Digital Converter

ADC: Analog, yani dalga halindeki sesi saklanabilecek digital veri formatina donusturmeye yarayan bir cesit sinyal olcen ve donusturen birimdir.
Amaci ham sinyalleri olcmek ve islemciye gondermektir.

DAC: Yukarida anlatmistim, kisaca tekrarlarsak, dijitallestirilmis sesleri duyabilecegimiz hale getiren birimdir, DSP biriminden sesleri alir.

DAC hassasligi cok onemli bir konudur, ornegin 24 bit ses islemcisi olan bir cihazin 24 bit DAC cikisi olmalidir, aksi halde kayiplar yasanir.
Yine frekans da ayni yada yukari degerlere sahip olmalidir.

DSP: Digital Signal Processor
Ses yada Goruntu sinyallerini isleyen birime denir, amaci sesi (konumuz ses oldugu icin oyle dedim) islemek, filtrelemek ve amaca gore DAC yada ana islemciye gondermektir.
Ses islemcisi ve dijital sinyal islemcisi aslinda ayni seyler degildir, bazen goruntu islemcisi ile birlestirilirken amaca yonelik sistemlerde ses birimlerinde DSP ye ihtiyac duyulmaz (ses kartlari, ANFI'ler, Ev sinema decoderleri) cunki kendilerine ait ozel islem birimleri yada islemcileri vardir.
Sound Processor denilen birim bu is icin tasarlanmistir ve en iyi sekilde gormektedir.
Buna bazen Digital Sound Processor de denmektedir, fakat Digital Signal Processor ile karisikligindan dolayi sadece Sound Processor yada Sound Chip olarak adlandirilmistir.
Hangi tur olursa olsun Analog ses isleyen bu birimler dijital ortamda ses saklamak, uretmek yada oynatmak icin kullanilir.
Bazi Ses chipleri kodlama yoluyla ses uretebilirler, MIDI synthesizer bunun en basit ornegidir.
Genel amacli DSP'lerin donanimsal filtrelemeleri pek olmaz yada bunun icin ek birim kullanilir HTC 10 yada LG V10 ornekleri sayilabilir.

Su anda en populer ses islemcisi markalarindan bazilari:
Yamaha, Cirrus Logic, Wolfson, Maxwell.
Urettikleri Chip'in verimine ve amacina gore degisik sistemlerde kullanilabilir ki bu firmalardan Wolfson, Yamaha ve Cirrus Logic uretimi chipler Creative Ses kartlarinda da kullanilir.

Ayrica...
DTS ve Dolby gibi ozel ses islemcileri de mevcuttur ama bu iki turevin de yazilimsal olan yontemleri de mevcut oldugundan benzer donanimlarda da calisabilmektedirler.
Fakat bu aslinda bir benzetme/taklit seklidir, ust duzey ses sistemlerinde fark kolayca anlasilir ama nispeten orta-giris seviyesi urunlerde sinyal kayiplarini farketmek neredeyse imkansizdir.

Modern ses oynaticilarinda ses icin DSP ayrica secilebilirken bazen goruntu isleme yongasi ile birlestirilir.

Fazla kullanilmayan teknolojiler: (Istek)
PDM, PWM gibi daha cok BitStream seklinde calisan teknolojilerdir, son kullaniciya yansimasi olsa da pek tutulmamistir.

PDM: Pulse Digital Modulation
PCM den farkli olarak verileri 1 Bit seklinde isler, veriler bir dongu suresince biriktirilip oyle islenir, frekans her bit blogu icin degisken olabilir frekans siniri yoktur.
Yani 1 sn icerisinde kac bit veri gelecegi degiskendir, frekans ve dongu araligi belirler.
Aslinda saniye bile onemli degildir, dongu araligi (cycle) nano saniyeye kadar dusebilir.
PCM de bu sabittir, 8-16-24-32-64 gibi...

1 Bit aktarima ihtiyac duymasina ragmen frekans degiskenliginin onemi yuzunden her alanda kullanilmasi pek mumkun degildir.
Ozellikle ses bozulmalarinin onune gecebilmek icin cok fazla onlem alinmasi gerektiginden PCM icin cok iyi bir alternatif olamamistir.

DSD (Direct Digital Stream) bunun pratikteki belki de ses icin tek kullanimidir.
PDM yorumlamasi olan bu teknolojide ilk denemesi olan Super Audio CD formatinda tam 28.224 khz degerinde frekans degerine sahip iken gunumuzdeki son versiyonu bunu 8'e katlamistir.
Single Rate DSD, Double-rate DSD, Quad-rate DSD ve Octuple-rate DSD versiyonlari bulunmaktadir.
Single Rate: 64*44 khz = 2822 mhz
Dual Rate : 128*44khz = 5644 mhz
Quad Rate : 256*44khz = 11289 mhz
Octuple Rate : 512*44khz = 22579 mhz = 22.6 ghz!

DSD hakkinda Bazi kucuk bilgiler:
Butun PCM turu veriler DSD olarak aktarilabilir, birden fazla kanal ayni anda tek bloktan aktarilabilecegi gibi sinirlama yoktur.
SNR orani PCM'ye gore yuksek olsa da telafi ve tolerans imkani bulunmaktadir.
DB degeri aktarim sirasinda degistirilebilir, onceden yukseltilmis ses aktarimi dalga boyu ile saglanir.
Kulakliklara bile bu frekansta ses aktarilabilme imkani mevcuttur ama ozel donanim ister.
Dosya boyutlari devasa boyutlara cikabildiginden pek tercih edilmemistir.

PWM: Pulse Width Modulation
Aslinda bu teknoloji ses icin pek kullanilmaz cunki basit bir DAC ile calismaz.
Daha cok Voltaj ve Amper degiskenliginin onemli oldugu alanlarda kullanilmaktadir, Aydinlatma, Motor, Lazer vs...
Fakat bunun ses filtrelemesi icin de kullanabilecegini dusunen bazi ses uzmanlari ozel sistemlere bu modulu eklemislerdir.
DSD ile birlikte kullanilir, 1 ile 8 bit arasinda degisebilen BitStream teknolojisi desteklediginden sinirsiz frekans ve veri kombinasyonu mumkundur.
Fakat bu teknoloji burada aktarilamayacak kadar karmasik ve benim ne yazikki tam olarak anlatamayacagim bir sistem bu yuzden daha derine inmeden burada bitiriyorum.

Evet...
Uzun bir yazi oldu, hatalarim olduysa mazur gormenizi temenni ederim.

Yanlis yada eksik olarak gordugunuz bir bolum varsa belirtirseniz severek duzeltirim.

Okudugunuz icin tesekkurler.

#Müzik #ses #teknobilgi #inceleme

BeğenFavori PaylaşYorum yap
  • Batuhan @achfighter

    Kafamı kemiren bir soru var. Bu Foobar2000'i herkes övüyor da niye övüyor onu anlamadım. Tüm medya dosyalarını oynatmak için Daum POT Player kullanıyorum. 24bit 96khz flac parçalarım var. Onları POT Player'da dinliyorum. Şimdi bunun yerine Foobar2000 kullansam aldığım sesin kalitesi artacak mı?

    Ayrıca Foobar2000'i toplum baskısından övenler de çok fazla(üniversitede kollektiflere üye olup Marx'ı öven ama Marx hakkında hiçbir şey bilmeyen hazırlıklar gibi). O zaman ben de onboard ses kartımla ve x530'umla oydofilim diyim. 🙂

  • aMeLeDeRViS @ameledervis

    Bazi eksikliklerin oldugunu dusundum, yeni bilgiler ekledim (DAC, ADC, DSP)

  • kurtcuk @kurtcuk

    Kafa karıştırması çok müsait bir konuyu dağınık ele almışsınız, biraz daha sadeleştiriseniz daha öğretici olabilir.

  • Tunç Karesioğlu @tunc-karesi

    Çok teşekkürler, ziyadesiyle latif bir yazı olmuş. İstirhamım odur ki, DSD'yi de anlatır mısınız?

  • Berk @brk

    Bir ara kulaklıklık incelemesi altına böyle bir bilgi paylaşmayı düşündüm, sonra üşenmiştim, sen yapmışsın, eline sağlık.

  • aMeLeDeRViS @ameledervis

    @tunc-karesi
    Yaziya ekledim 🙂

    @brk
    Begendiginize sevindim...

    @frknl
    Yok ben bunu toparlayamam, ne kadar dusunduysem de olmadi 😀

  • homosapien @biggestliar

    Öncelikle ellerinize sağlık @ameledervis üstadım... 2kere okudum: üniversitede okusaydım sadece kopyala-yapıştır yapıp ödev olarak kullanırdım kesinlikle 🙂

    Üstad dünkü sorduğum "Örneğin dijital ses olarak 16 bit’te max (hatırladığım kadarıyla) 96 khz ses alınıyordu. Peki, ben bu sesi (atıyorum) 32 bit 192 khz ‘e yükseltmeyi amplifikator ile yapılabilir mi? yoksa yükseltme sadece bit değeri artmadan hertz cinsinden mi oluyor?" sorusuna kendi çıkardığım cevap şöyle:

    Sesin kalitesinde asıl olan kaynağı olduğu için 8 bit derinlikte kayıt yapılmış bir sesi benim sorduğum gibi amplifikatör ile derinliğini değiştiremiyoruz. Amplifikatör ile sadece frekansı ile oynayarak sesin şiddetini (dB) değiştirebiliyoruz. Sesin kalitesinin de en büyük etken bit (derinlik) olduğuna göre (2'li sayısı siteminin üst değerine eşit olduğu için); bit değerini değiştirmek (görece daha kaliteli olması için) DSP ile yeniden işlenerek DAC'a yeniden göndermesi gerekli.

    Yarım aklım bu kadar anladı maalesef 🙁

  • des_955 @des_955

    @ameledervis merhaba hocam güzel bir yazı olmuş ellerine sağlık

  • des_955 @des_955

    @achfighter merhaba hocam foobarın övülme nedeni asio ve wasapi desteği ama asio için ses kartının veya dacında desteklemesi gerekiyor bu şekilde daha iyi bir performans alınıyor wasapiyi normal bir kartla kullanıyorsunuz ama bu seferde windowsta açtığınız herhangi bir başka ses dosyasının sesini alamıyorsunuz buda dezavantajı ses olarak değiştiriyormu derseniz ben 2 sinide denedim fark ediyor ama ben başka yazılımlarda kullandığım için bana göre değil eğer amacınız müzik ise x-530 gibi 5.1 leri bırakın 2.0 stereo ya geçin odyofil olmaz zor zanaattır 🙂

  • aMeLeDeRViS @ameledervis

    @des_955
    Begendiginize sevindim 🙂

    @biggestlier
    Bit derinligini frekans araligi belirliyor yani spektrum ne kadar genis ise bit derinligi dogru orantili olarak yukseliyor ama bu PCM icin gecerli sadece.
    16 Bit @ 96khz genisligi yani DVD kalitesinde ses demek 🙂
    PCM native bir format oldugu icin ses'lerin sayisal isaretlenmis hali yani golgesidir diyebiliriz bu sebeple sadece AMP ile yapilamaz arada Log, low-pass filter, Synthesizer gibi araclar ile kaynagin spectrumu genisletilerek mumkun.
    Ama Background Noise denilen gurultunun yuksek bantlarda artmasi falan bazi ek yontemler gerektiriyormus.
    PWM-PDM gibi sistemler aslinda tam sizin istediginiz isi yapmak icin tasarlanmis 😀

    • homosapien @biggestliar

      Birşey yapacağından değil üstad. Kendi "bilgi açlığım" için öğrenmek istiyorum. Zaten Miriam Stockley, Emma Shaplin dinleyen bir tipim.

      Pwm ile tek saykılda tek bir bit derinliği için 2^8'e kadar frekans şiddet üretilebilir. Karşılığında sadece 1 Bit'de bu kadar yüksek frekans elde edildiği için yüksek oranda noise yaratır.

      Dediğiniz gibi lazer, yani aşırı yoğun ( yüksek frekansta ) ışık üretimindeki prensibin aynısını ses için kullanılıyor. Sonuçta ikiside frekansları sayesinde taşıdıkları enerji ile doğru orantılı...

      Teşekkür ederim.

    • aMeLeDeRViS @ameledervis

      @biggestlier
      Evet, ek bilgiler icin de ben tesekkur ederim.
      Hepimiz bilgiye aciz sonucta 😀

    • homosapien @biggestliar

      "3D/GL/Vulkan nedir?" Başlıklı incelemenizin 3. bölümünü sabırsızlıkla bekliyorum...

  • Emre CESTEL @ecestel

    Benim gibi konunun cahili insanlar için çok iyi olmuş. Teşekkürler.

  • Aykut Elmas @aykutelmas

    Hi-Res müzikleri nereden edinebiliriz? Bazı arkadaşlar torrentden indiriyor ama ben o işe sıcak bakmıyorum, hem güvenli görmüyorum hem de nasıl dönüştürdüklerini bilmiyorum, yani mp3'den de dönüştürmüş olabilirler. Bir diğer sorum da 1000TL altında Hi-Res kulaklık önerebilir misiniz?

  • Alp Özcaner @alp-ozcaner

    Yazı için elinize sağlık öncelikle. İzmir de bulunan Relics adlı grubun bateristiyim ve Sacd & kaliteli müzik formatlarında müzik dinleme konusundada çok ilgili heyecanlı biriyim. Sizinle bu konular hakkında yazışmak isterim. Uygun olursa tabi. Telefonum 507-944-37-48 ismim Alp...Teşekkürler..

Bu ürünle ilgili tüm incelemeler