כיצד פועלות אפליקציות תרגום דיבור לחתולים?

כיצד פועלות אפליקציות תרגום דיבור לחתולים?

סביר להניח שראית אפליקציות שטוענות לתרגם את מה שהחתול שלך אומר. אבל האם הם באמת יכולים לתרגם את המיאו של החתול שלך לאנגלית? התשובה הקצרה היא כן, בערך. זה קשה בגלל כמה הייחודיות לשפה של כל חתול, אבל הם יכולים להתקרב למדי עם הטכנולוגיה המודרנית.





אפליקציות לתרגום חתולים כמו MeowTalk משתמשות בצורה של זיהוי דיבור המדגיש למידת מכונה. בואו נסתכל מקרוב.





זיהוי דיבור ולמידת מכונה

מרי תרזה מקלין/ פיקסביי





זיהוי הדיבור פועל על ידי הקלטת דיבור והפיכת השמע לקובץ נתונים דיגיטלי. הוא מקודד נתונים כגון המגרש והנפח כנקודות נתונים שהאפליקציה יכולה לנתח ולהתאים למשמעויות. מיקרופוני DPA מסביר שנקודות נתונים אלה יכולות להיראות שונות מאוד בהתאם לצלילי הרקע וכיצד מדברים מילה.

לפעמים אנו לוקחים את ההכרה הקולית כמובנת מאליה, אך זהו הישג טכנולוגי מדהים. במיוחד בהתחשב עד כמה מורכב הדיבור האנושי. כפי ש המדען מסביר, כל מילה כוללת מגוון רחב של צלילים או 'פונמות' המתמזגות זו בזו. לגרום למחשב להבין את הדיבור קשה מאוד. הגבול החדש של קולות החתול יהיה קשה עוד יותר.



אפליקציות המשתמשות בזיהוי דיבור מתוכנתות עם 'אוצר מילים' של מילים הנקראות מערך נתונים. לאחר מכן האפליקציה מתאימה את הנאום שלך לאפשרות הקרובה ביותר באוצר המילים שלה.

כאשר הוא עושה טעות, אתה מתקן אותם, והוא שומר את הנתונים האלה לפעם הבאה. זה חלק מלמידת מכונה. כך תוכנית לומדת לזהות דיבור גם כשהוא לא זהה למערך הנתונים שהתחיל איתו.





קשורים: מהם אלגוריתמים של למידת מכונה? הנה איך הם עובדים

לזיהוי קולי עדיין יש בעיות, במיוחד עם בעיות ומבטאים בדיבור. עם זאת, חלק מהחברות משפרות את למידת המכונה כדי להתגבר על בעיות אלה. עם הזמן, למידת מכונה יכולה להפוך זיהוי דיבור לכלי רב עוצמה.





למה אני לא מקבל התראות באייפון שלי?

כך פועלת זיהוי דיבור לבני אדם. אבל האם זה עובד לחתולים?

זיהוי דיבור לעומת זיהוי מיאו

אריאנה סוארס / Unsplash

ראשית, עלינו להבין מדוע תרגום סוג מסוים של מיאו כ'אני רעב 'שונה מניתוח דיבור אנושי. הבעיה היא בעיקר שתקשורת חתולים נשענת יותר על סממנים לא מילוליים כמו יציבה. בעיה נוספת היא היעדר 'שפת חתולים' אוניברסלית.

על פי ASPCA , חתולי פרא מבוגרים אף פעם לא מגנחים זה על זה, רק על אנשים. מחקר אחר מאת החברה ההומנית מוסיף כי צלילים אלה 'אינם מתרחשים בחלל ריק'. עלינו לפרש אותם לצד שפת גוף והקשרים אחרים. במקרים רבים, האותות השקטים האלה הם ההבדל היחיד בין מיאו שמשמעותו 'אני רעב' לאחד שמשמעותו 'אני רוצה לשחק'.

בנוסף לבעיה זו, אין לשני חתולים אותה שפה. חתולים מפתחים 'שפות' מותאמות אישית לבעליהם. אלה מבוססים בחלקם על חיקוי קולו של הבעלים וחלקם על אישיותו של החתול. אין שני חתולים שנשמעים אותו דבר, גם כאשר הם מעבירים את אותו הרצון או הצורך. אז איך אפשר לתרגם את אוצר המילים של אפליקציה אחת לכולם?

למידת מכונה גמישה לחתולים

חינם לשימוש בקולות/ Unsplash

למרות שכמה עוזרים וירטואליים אוהבים אוטומטי בניסיון להבין את הטון והרגש, זיהוי הדיבור עדיין נורא באותות לא מילוליים. אבל זה לא אומר שאי אפשר לפרש אותם.

כיצד לגרום לסמל הסוללה להופיע חלונות 10

MeowTalk משתמשת בלמידת מכונה גמישה יותר כדי לסייע להתגבר על בעיות אלה.

הורד: MeowTalk עבור דְמוּי אָדָם | ios (חינם)

Meowtalk נוצר על ידי חאבייר סאנצ'ס, שעבד גם הוא בצוות אלקסה. הוא דמיין את האפליקציה כצעד לקראת צווארונים חכמים. צווארונים אלה יתרגמו קולות חתולים לדיבור אנושי, תוך התבססות על אסטרטגיות מורכבות של למידת מכונה כדי לסייע לבני אדם להבין טוב יותר ולדאוג לחתוליהם.

צוות MeowTalk פיצה על בעיות ייחודיות על ידי יצירת פרופילים ספציפיים יותר לכל חתול. באפליקציה, אתה רושם כל חתול בנפרד. מדע נורבגיה מדווחת שחתלתולים מיועים בצורה שונה מאשר חתולים מבוגרים, ולכן האפליקציה מבקשת גם את יום ההולדת של החתול. כל פרופיל יוצר רשת נתונים ייחודית לחתול, המשלבת מעט למידה עמוקה בלמידת המכונה.

קשור: למידה עמוקה מול למידת מכונה מול AI: איך הם הולכים יחד?

עבור אוצר מילים, MeowTalk מתחיל עם 10 פרופילי קול במערך הנתונים שלו. לכל אחד יש משמעות שונה, כמו 'שמח' או 'ציד'. כאשר האפליקציה שומעת צליל ושגויה בה, אתה יכול לתקן אותו או ליצור פרשנות חדשה.

נתוני CATSOUNDS שנאספו מ אקבלון

תיקון אומר לאפליקציה להחליף את אוצר המילים הבסיסי בצליל החדש.

wifi אומר מחובר אבל אין אינטרנט

לדוגמה, אתה יכול להגיד לאפליקציה להתאים 'ציד' לציוץ קצר במקום לעוף ארוך. תיקון מסוג זה שימושי יותר מאשר הוספת צלילים מרובים שיתאימו למשמעות אחת המשמעות של האופן שבו זיהוי הדיבור מתנהל, וזה יהיה כמו להגיד לאפליקציה צהוב ארוך וציוצים קצרים שניהם כלומר 'שיחת אמא'.

למידת מכונה באפליקציות לזיהוי דיבור בדרך כלל מתנגדת להחלפה מסוג זה. זה יהיה כמו לנסות ללמד את סירי שכאשר אתה אומר 'בלוג טכנולוגי', אתה באמת מתכוון ל'אגס '. אך הצורה הגמישה יותר של למידת מכונה בה משתמשת MeowTalk יכולה להתמודד עם תיקון זה ביתר קלות.

יצירת פרשנות חדשה מוסיפה משמעות שלא קודדה קודם לכן. לדוגמה, אם לחתול שלך יש שיחה ספציפית כשהיא רוצה הצעצוע האהוב עליה, תוכל להוסיף 'אני רוצה את העכבר שלי' כאופציה. זה דומה להוספת מילה למילון התיקון האוטומטי שלך.

קָשׁוּר: כיצד להגדיר מילים לתיקון אוטומטי משלך באנדרואיד

עם הזמן, תוכל לפתח פרופיל דיבור מותאם אישית עבור החתול שלך. בסופו של דבר, זה עשוי להיות אפילו מתוחכם מספיק כדי להיות שימושי עבור חיות מחמד או לפתור בעיות התנהגותיות. אם שום דבר אחר, זה עוזר לבעלי החתולים להיות קשובים יותר לחיות המחמד שלהם.

פסק הדין: האם אפליקציות לתרגום חתולים פועלות?

בסופו של דבר, 'תרגום החתול' עדיין מסתמך רבות על כך שהמשתמש מלמד את האפליקציה כיצד החתול שלהם מדבר. זה כנראה תמיד יהיה המצב בגלל ייחוד התקשורת של כל חתול.

אבל העובדה שלמידת מכונה הגיעה עד כדי כך שמפתחים יכולים אפילו להצליח באופן חלקי בכך היא מדהימה. למידת מכונה ו- AI מתקדמים במהירות מסחררת, ואנחנו לא יכולים לחכות לראות לאן הם הולכים הלאה.

לַחֲלוֹק לַחֲלוֹק צִיוּץ אימייל נושאים קשורים
  • הסבר על הטכנולוגיה
  • למידת שפה
  • למידת מכונה
על הסופר נטלי סטיוארט(פורסמו 47 מאמרים)

נטלי סטיוארט היא כותבת ב- MakeUseOf. היא התעניינה לראשונה בטכנולוגיה במכללה ופיתחה תשוקה לכתיבת מדיה באוניברסיטה. ההתמקדות של נטלי היא בטכנולוגיה נגישה וקלה לשימוש, והיא אוהבת אפליקציות ומכשירים שהופכים את החיים לפשוטים יותר עבור אנשים רגילים.

עוד מאת נטלי סטיוארט

הירשם לניוזלטר שלנו

הצטרף לניוזלטר שלנו לקבלת טיפים, סקירות, ספרים אלקטרוניים בחינם ומבצעים בלעדיים!

לחצו כאן להרשמה