Snore Timeline लोगो Snore Timeline सहायता ऐप खोलें
रिकॉर्डिंग

ध्वनि पहचान कैसे काम करती है

ऐप किन ध्वनियों को सुनता है, यह कैसे निर्णय लेता है, और संख्याओं का क्या मतलब होता है।

इस पृष्ठ पर

Snore Timeline रात भर के कच्चे ऑडियो को ऐसे लेबल किए गए इवेंट में बदल देता है जिन पर आप भरोसा कर सकते हैं, और जब आप जानते हैं कि वे कैसे बनते हैं तो उन पर भरोसा करना आसान हो जाता है। यह पृष्ठ वर्गीकरण प्रक्रिया को समझाता है: ऐप किन ध्वनियों को सुनता है, यह कैसे तय करता है कि आपकी टाइमलाइन पर क्या दिखेगा, डेसिबल संख्याओं और नारंगी वेवफ़ॉर्म रंगों का क्या मतलब है, और शोर भरा कमरा परिणामों को क्यों बदल देता है।

ऐप जिन ध्वनियों को वर्गीकृत करता है

हर शोर को खर्राटे के रूप में मानने के बजाय, ऐप जो सुनता है उसे छह मुख्य श्रेणियों में बाँट देता है:

  • खर्राटे, मुख्य इवेंट। हर पहचान अपने ध्वनि स्तर के साथ टाइमलाइन पर दिखती है।
  • हाँफना, अचानक साँस अंदर खींचना जो अक्सर साँस के रुकने के बाद होता है।
  • खाँसी, जिसे खर्राटों में शामिल करने के बजाय अपनी अलग श्रेणी के रूप में ट्रैक किया जाता है।
  • नींद में बोलना: बातचीत, फुसफुसाहट और बुदबुदाना।
  • हँसी, क्योंकि सोते लोग हँसते भी हैं।
  • तेज़ ध्वनियाँ, आपके द्वारा तय की गई सीमा से ऊपर की अचानक आवाज़ें (नीचे बताया गया है)।

खर्राटे, हाँफना और खाँसी मिलकर श्वसन समूह बनाते हैं। ऐप रात भर साँस के पैटर्न पर भी नज़र रखता है; लगभग 10 या अधिक सेकंड की खामोशी, जिसके बाद कोई रिकवरी ध्वनि आती है जो उससे पहले की खामोशी से स्पष्ट रूप से तेज़ होती है, उसे साँस में बाधा के रूप में चिह्नित किया जाता है। साँस की बाधाएँ इन्हें विस्तार से बताती है।

यह खर्राटे और खाँसी में फ़र्क कैसे पहचानता है? हर ध्वनि प्रकार की एक पहचानने योग्य ध्वनिक छाप होती है। खर्राटे अपनी अधिकांश ऊर्जा निम्न और मध्यम फ़्रीक्वेंसी रेंज में, लगभग 50 Hz से 3 kHz, रखते हैं, जो उन्हें बातचीत, खाँसी और परिवेश के शोर से अलग करता है। वर्गीकरणकर्ता हर ऑडियो खंड को लेबल देने से पहले ध्वनि पैटर्न और फ़्रीक्वेंसी विशेषताओं, दोनों को तौलता है। अधिकांश परिवेश का शोर अनदेखा कर दिया जाता है।

कोई भी पहचान प्रणाली पूर्ण नहीं होती। जब दो ध्वनियाँ एक-दूसरे पर आ जाती हैं या बिस्तर किसी एक को दबा देता है, तो कोई इवेंट गलत श्रेणी में आ सकता है। अगर कोई लेबल गलत लगे, तो उस पल का ऑडियो वापस चलाएँ और सुनें कि क्या हुआ था। यहाँ जो कुछ भी है वह व्यक्तिगत समझ के लिए ऑडियो विश्लेषण है; ऐप स्लीप एप्निया या किसी अन्य स्थिति का निदान नहीं करता।

रीयल-टाइम विश्लेषण, बिना सैंपलिंग के

आपके डिवाइस तक सीमित माइक्रोफ़ोन रात भर सुनता है डिवाइस पर AI रीयल टाइम खर्राटा हाँफना खाँसी नींद में बोलना साँस पहचाने गए इवेंट
ऑडियो उसी पल वर्गीकृत होता है जब वह घटित होता है, पूरी तरह आपके फ़ोन पर। हर ध्वनि रीयल टाइम में प्रोसेस होकर लेबल की जाती है; इनमें से कुछ भी सैंपल या कहीं भेजा नहीं जाता।

कुछ ऐप बैटरी बचाने के लिए सैंपलिंग करते हैं: वे समय-समय पर जागते हैं, एक पल के लिए सुनते हैं, और फिर सो जाते हैं, जिसका मतलब है कि बीच में जो कुछ होता है उसे वे चूक सकते हैं। Snore Timeline आपके फ़ोन पर चलने वाले Apple के Sound Analysis फ़्रेमवर्क का उपयोग करके आपके ऑडियो का लगातार विश्लेषण करता है। हर ध्वनि उसी पल प्रोसेस होती है जब वह घटित होती है। कुछ भी छोड़ा, सैंपल या अपलोड नहीं किया जाता।

लगातार विश्लेषण के दो ऐसे परिणाम हैं जिन पर आप ध्यान देंगे:

  • पहचान तुरंत शुरू हो जाती है। कोई कैलिब्रेशन या सेटअप चरण नहीं है; रात का पहला खर्राटा भी सौवें खर्राटे जितना ही मायने रखता है।
  • टाइमलाइन पूरी होती है। चूँकि ऐप कभी सुनना बंद नहीं करता, आपकी टाइमलाइन पर एक शांत अंतराल का मतलब है कि कमरा शांत था, और ये अंतराल स्वयं साँस और नींद के चरण के विश्लेषण के लिए डेटा बन जाते हैं।

यह सब डिवाइस पर ही चलता है। आपका ऑडियो कभी आपके फ़ोन से बाहर नहीं जाता, और गोपनीयता नीति बताती है कि व्यवहार में इसका क्या मतलब है।

संवेदनशीलता और गलत पहचान

हर ध्वनि चुनी नहीं जाती। ऐप किसी ध्वनि को इवेंट के रूप में तभी दर्ज करता है जब वह उसकी किसी श्रेणी से पर्याप्त रूप से मेल खाती हो, इसी तरह वह एक चरमराते रेडिएटर को आपकी रात को नकली खर्राटों से भरने से रोकता है।

यह सीमा कितनी कड़ी हो, इसे आप संवेदनशीलता सेटिंग से नियंत्रित करते हैं, जिसके पाँच स्तर हैं: न्यूनतम, कम, संतुलित, उच्च और अधिकतम। संतुलित डिफ़ॉल्ट है।

  • न्यूनतम केवल स्पष्ट, तेज़ खर्राटों को पकड़ता है और बाकी लगभग सब कुछ अनदेखा कर देता है। इसे शोर भरे कमरे के लिए चुनें या जब किसी साथी के खर्राटे बार-बार डिटेक्टर को चालू कर देते हों।
  • अधिकतम बहुत हल्के खर्राटों को भी पकड़ता है लेकिन साथ ही ज़्यादा पृष्ठभूमि शोर भी उठाता है और अधिक गलत पहचान दर्ज करता है।
सुझाव

अपनी टाइमलाइन को बताने दें कि किस दिशा में समायोजन करना है। बहुत सारे आवारा इवेंट जो वापस चलाने पर कुछ नहीं निकलते? संवेदनशीलता कम करें। ऐसे खर्राटे जो रिकॉर्डिंग में सुनाई देते हैं लेकिन ऐप चूक गया? इसे बढ़ाएँ। शुरुआती बिंदु के रूप में संतुलित अधिकांश लोगों के लिए अच्छा काम करता है।

डेसिबल और फ़्रीक्वेंसी रंग

ध्वनि की तीव्रता पूरे ऐप में dB SPL में दिखती है, लगभग 28 dB, जो लगभग-खामोशी का संदर्भ है, से लेकर 105 dB तक, जो किसी अत्यधिक तेज़ ध्वनि के लिए है, इस पैमाने पर। इसे वॉल्यूम मीटर की तरह पढ़ें: ऊँची संख्याएँ तेज़ ध्वनि दर्शाती हैं। आपके खर्राटों के लिए एक मोटे अनुमान के रूप में:

  • लगभग 40 dB से नीचे: हल्के खर्राटे
  • 40 से 48 dB: धीमे खर्राटे
  • 48 से 56 dB: सुनाई देने वाले खर्राटे
  • 56 dB और उससे ऊपर: तेज़ खर्राटे

ऐप हर एपिसोड के लिए शिखर और औसत, दोनों डेसिबल स्तरों को ट्रैक करता है। ये संख्याएँ व्यक्तिगत संदर्भ के लिए हैं, कोई नैदानिक माप नहीं।

ऐप पहचानता है कि कौन-सा माइक्रोफ़ोन उपयोग में है, और जब आपका फ़ोन ऑडियो चला रहा होता है, जैसे संगीत या पॉडकास्ट, तो वह रीडिंग को समायोजित करता है।

हर ध्वनि फ़्रीक्वेंसी का मिश्रण होती है, और फ़्रीक्वेंसी बस यह है कि हवा कितनी तेज़ी से कंपन करती है, जिसे हर्ट्ज़ (Hz) में मापा जाता है। निचली ध्वनियाँ धीरे कंपन करती हैं; ऊँची ध्वनियाँ तेज़ी से कंपन करती हैं। प्ले दबाएँ और खींचें ताकि इसे सुन सकें और तरंग को कसते हुए देख सकें:

160 Hz
स्लाइडर खींचें — ऊँची पिच तेज़ी से कंपन करती है
यह वही पैमाना है जिस पर नीचे की बैंड बनी हैं: धीमे कंपन निम्न बैंड हैं, तेज़ कंपन उच्च बैंड हैं। खर्राटे निचले हिस्से में रहते हैं; साँस छोड़ने की हल्की सिसकारी उच्च हिस्से में रहती है। इसे सुनने के लिए हेडफ़ोन या स्पीकर ज़रूरी हैं।

वेवफ़ॉर्म पर पूरी तरह ज़ूम करें और बार नारंगी की परतदार छायाओं में बँट जाती हैं जो दिखाती हैं कि हर ध्वनि की ऊर्जा फ़्रीक्वेंसी के अनुसार कहाँ बैठती है:

  • गहरा नारंगी: निम्न फ़्रीक्वेंसी, लगभग 50 से 250 Hz, खर्राटों की गहरी गड़गड़ाहट।
  • मध्यम नारंगी: मध्यम फ़्रीक्वेंसी, लगभग 250 से 1500 Hz, हार्मोनिक्स और स्वर ध्वनियाँ।
  • चमकीला नारंगी: उच्च फ़्रीक्वेंसी, लगभग 1500 से 8000 Hz, "sss" के "s" जैसी सिसकारी ध्वनियाँ।
0:00 उच्च मध्यम निम्न
वास्तविक रिकॉर्डिंग, उसी तरह रंगी हुई जैसे ऐप वेवफ़ॉर्म को रंगता है: हर बार निम्न, मध्यम और उच्च फ़्रीक्वेंसी ऊर्जा में बँटी हुई। प्ले दबाएँ और रेखा का अनुसरण करें। साँस के साथ, देखें कि हर साँस छोड़ने पर चमकीली उच्च बैंड कैसे उठती है जबकि ध्वनि धीमी रहती है। खर्राटों के साथ, गहरी निम्न बैंड हावी रहती है। उस उच्च-बैंड लय में एक अंतराल ही किसी संभावित साँस की बाधा की ओर इशारा करता है।

चमकीली, उच्च-फ़्रीक्वेंसी बैंड वह है जो साँस के लिए सबसे ज़्यादा मायने रखती है। हर साँस छोड़ने पर एक हल्की सिसकारी बनती है, किसी कोमल “sss” की तरह, और वह सिसकारी उच्च बैंड में बैठती है। Snore Timeline रात भर आपकी साँस का अनुसरण करने के लिए इसे सुनता है, और यही साँस-बाधा पहचान और नींद के चरण के अनुमानों को संचालित करता है। यही वजह है कि बहुत दूर रखा फ़ोन या शोर भरा कमरा इन सुविधाओं को कमज़ोर कर देता है: सिसकारी धीमी होती है, और सबसे पहले यही खो जाती है।

फ़्रीक्वेंसी का विवरण केवल सबसे ज़्यादा ज़ूम किए गए दृश्य में दिखता है; ज़्यादा चौड़े ज़ूम स्तरों पर बार ठोस रंग में दिखती हैं। टाइमलाइन और प्लेबैक समग्र रूप से वेवफ़ॉर्म पढ़ने को समझाता है।

आज़माएँ

अपनी रात के किसी शांत हिस्से पर पूरी तरह ज़ूम करें और चमकीले नारंगी के छोटे झोंके ढूँढें जिनके नीचे बहुत कम रंग हो। वह आपकी साँस है, केवल ध्वनि के माध्यम से देखी गई।

ऐप की पूरी स्क्रीन
ज़ूम किया हुआ खर्राटे के एपिसोड के दौरान परतदार नारंगी फ़्रीक्वेंसी बैंड के साथ ज़ूम किया हुआ वेवफ़ॉर्म
सबसे ज़्यादा ज़ूम किए गए दृश्य पर फ़्रीक्वेंसी रंग।

तेज़ ध्वनि पहचान

वर्गीकरणकर्ता खर्राटों और नींद में बोलने को अपने आप संभालता है। तेज़ ध्वनि पहचान बाकी सब चीज़ों के लिए है: यह तब एक एपिसोड बनाती है जब कोई ध्वनि आपके चुने हुए वॉल्यूम सीमा से ऊपर उठती है, चाहे वह ध्वनि कुछ भी हो। यह उन शोरों को पकड़ती है जिन्हें वर्गीकरणकर्ता नाम नहीं दे सकता, जैसे फुसफुसाकर नींद में बोलना जो बोली के रूप में दर्ज होने के लिए बहुत धीमा है, दाँत पीसना, हिलते-डुलते समय निकलने वाली आवाज़ें, या अन्य अज्ञात रात्रि शोर।

डिफ़ॉल्ट सीमा 55 dB है। अपने कमरे के लिए उपयुक्त सीमा चुनने के लिए:

  1. एक रिकॉर्डिंग शुरू करें और शांत रहें।
  2. देखें कि आपके कमरे के आधारभूत शोर के लिए टाइमलाइन कौन-सा dB स्तर दिखाती है।
  3. सीमा को उस स्तर से ठीक ऊपर सेट करें।

एक शांत कमरा आपको कम सीमा का उपयोग करने और अधिक पकड़ने देता है।

आप ऐसी ध्वनियों को भी तेज़ ध्वनि श्रेणी में आता देख सकते हैं जिन्हें आप खर्राटे होने की उम्मीद कर रहे थे। यह तब होता है जब पृष्ठभूमि का शोर उन साँस के पैटर्न को ढक देता है जिन्हें खर्राटा वर्गीकरणकर्ता सुनता है; वर्गीकरणकर्ता को खर्राटे पहचानने के लिए एक स्पष्ट संकेत चाहिए, और जब कोई कमरा आधार स्तर पर लगभग 45 dB से ऊपर रहता है, तो अधिक ध्वनियाँ खर्राटे एपिसोड के बजाय तेज़ ध्वनि संकेतों के रूप में दर्ज होती हैं। अगला भाग बताता है कि इस बारे में क्या करें।

पृष्ठभूमि का शोर पहचान को कैसे प्रभावित करता है

लगातार चलने वाला पृष्ठभूमि शोर जैसे एयर कंडीशनर, पंखा, यातायात, संगीत, बारिश या समुद्र की आवाज़ अलग से ट्रैक की जाती है और आपकी टाइमलाइन पर खर्राटे इवेंट नहीं बनाती। ऐप इन्हें अलग-अलग खर्राटों के बजाय निरंतर परिवेश शोर के रूप में पहचानता है, इसलिए केवल गुनगुनाता AC आपकी रात को नकली खर्राटों से नहीं भर देगा।

लगातार शोर की असली कीमत मास्किंग है। एक तेज़ शोर तल धीमी साँस और हल्के खर्राटों को दबा देता है, जिससे वर्गीकरणकर्ता के पास काम करने के लिए कम संकेत बचता है। दो बातें इससे निकलती हैं:

  • हल्की ध्वनियों को पहचानना बिल्कुल ही कठिन हो जाता है।
  • आधार स्तर पर लगभग 45 dB से ऊपर वाले कमरों में, वे ध्वनियाँ जो अन्यथा खर्राटों के रूप में वर्गीकृत होतीं, तेज़ ध्वनि श्रेणी में चली जाती हैं।

अधिक साफ़ वर्गीकरण पाने के लिए, जहाँ हो सके कमरे को शांत करें। आम संदिग्ध हैं पंखे और व्हाइट नॉइज़ मशीनें, HVAC और एयर प्यूरीफ़ायर, यातायात की ओर खुली खिड़कियाँ, और चलते छोड़े गए TV या ऑडियो। एक शांत कमरा कुल मिलाकर अधिक सटीक पहचान देता है।

जब आप शोर को नियंत्रित नहीं कर सकते, उदाहरण के लिए किसी होटल के कमरे में, तो जो उपलब्ध है उसी से काम चलाएँ:

  • फ़ोन को अपने सिर के पास ले जाएँ ताकि साँस की आवाज़ें गुनगुनाहट के बावजूद सुनाई देती रहें। शुरुआत करना प्लेसमेंट को विस्तार से बताता है।
  • संवेदनशीलता बढ़ाएँ ताकि ऐप पृष्ठभूमि के ऊपर भी धीमी ध्वनियों को पकड़ सके।
ऐप की पूरी स्क्रीन
ज़ूम किया हुआ शिखर और औसत डेसिबल तथा तेज़ ध्वनि संकेत बैज के साथ पहचाने गए तेज़ ध्वनियों का एपिसोड
45 dB शोर तल से ऊपर रिकॉर्ड की गई एक रात।