AI ڈکٹیشن ایپس نے مختصر وقت میں ایک طویل سفر طے کیا ہے۔ سالوں سے وہ سست اور غلط تھے - جب تک کہ آپ کسی خاص لہجے کے ساتھ بات نہ کریں اور واضح طور پر بیان نہ کریں۔
بڑے لینگوئج ماڈلز (LLMs) اور اسپیچ ٹو ٹیکسٹ ماڈلز میں پیشرفت نے اس میں تبدیلی کی ہے، ایسے سسٹمز تیار کیے ہیں جو متن کو درست طریقے سے فارمیٹ کرنے کے لیے کافی سیاق و سباق کو برقرار رکھتے ہوئے تقریر کو زیادہ درست طریقے سے سمجھ سکتے ہیں۔ ڈویلپرز نے فلر الفاظ کو خود بخود ہٹانے، ٹھوکریں ٹھیک کرنے، اور اوقاف کو ہینڈل کرنے کے لیے خصوصیات بھی تیار کی ہیں - متن کو آؤٹ پٹ کرنا جس میں بہت کم ترامیم کی ضرورت ہے۔
اس طرح کی درجنوں ایپس کے ساتھ اب مارکیٹ میں، ہم نے اس وقت دستیاب بہترین اور سب سے مفید ڈکٹیشن ایپس کے لیے اپنے انتخاب کو جمع کر لیا ہے۔
Wispr Flow ایک اچھی طرح سے فنڈڈ AI ڈکٹیشن ایپ ہے جو آپ کو ڈکٹیشن کے لیے حسب ضرورت الفاظ اور ہدایات شامل کرنے دیتی ہے۔ اس میں میک او ایس، ونڈوز اور آئی او ایس کے لیے مقامی ایپس ہیں۔ ایک اینڈرائیڈ ورژن کام کر رہا ہے۔
ایپ آپ کو مختلف قسم کی تحریروں، جیسے ذاتی پیغام رسانی، کام اور ای میل کے لیے "رسمی"، "آرام دہ" اور "انتہائی آرام دہ" طرزوں میں سے انتخاب کرکے آپ کے متن کو کس طرح نقل کرتی ہے۔ اور اگر آپ اسے کرسر جیسے وائب کوڈنگ ٹولز کے ساتھ استعمال کرتے ہیں، تو آپ چیٹ میں متغیرات یا ٹیگ فائلوں کو خود بخود پہچاننے کے لیے فیچر آن کر سکتے ہیں۔
ایپ آپ کو ڈیسک ٹاپ پر ہر ہفتے 2000 الفاظ تک مفت، اور iOS پر ماہانہ 1000 الفاظ تک نقل کرنے دیتی ہے۔ بامعاوضہ سبسکرپشن پلانز لامحدود ٹرانسکرپشن پیش کرتے ہیں اور ہر ماہ $15 سے شروع ہوتے ہیں۔
ولو خود کو ان لوگوں کے لیے ایک بڑے وقت بچانے والے کے طور پر اشتہار دیتا ہے جو ٹائپ کرنا پسند نہیں کرتے۔ خودکار ترمیم اور فارمیٹنگ جیسی عام خصوصیات کے ساتھ ساتھ، ایپ صرف چند متعین الفاظ سے متن کا مکمل حصہ تیار کرنے کے لیے بڑے زبان کے ماڈلز کا استعمال کرتی ہے۔
Willow تمام ٹرانسکرپٹس کو مقامی طور پر آپ کے آلے پر اسٹور کرکے مزید پرائیویسی پر مرکوز نقطہ نظر اختیار کرتا ہے اور آپ کو ماڈل ٹریننگ سے مکمل طور پر آپٹ آؤٹ کرنے دیتا ہے۔ یہ آپ کو اپنی صنعت کی اصطلاحات، یا آپ کی مقامی بولی کے مطابق ڈھالنے میں مدد کے لیے حسب ضرورت الفاظ شامل کرنے دیتا ہے۔
Willow آپ کو اس کی ڈیسک ٹاپ ایپ پر ماہانہ 2000 الفاظ مفت میں لکھنے دیتا ہے۔ انفرادی سبسکرپشن پلانز ہر ماہ $15 سے شروع ہوتے ہیں، لامحدود ڈکٹیشن کو غیر مقفل کرتے ہوئے اور ایپ کو آپ کے تحریری انداز کو یاد رکھنے کے قابل بناتے ہیں۔
اگر رازداری اگر آپ کی ترجیح ہے تو، Monologue آپ کو اپنے ڈیٹا کو مکمل طور پر کلاؤڈ سے دور رکھتے ہوئے، ٹرانسکرپشن کے لیے اپنے AI ماڈل کو براہ راست اپنے ڈیوائس پر ڈاؤن لوڈ کرنے دیتا ہے۔ مزید یہ کہ آپ جس ایپ کے ساتھ اسے استعمال کرتے ہیں اس کے لحاظ سے ایپ آپ کو اس کے لہجے کو حسب ضرورت بنانے دیتی ہے۔
Monologue آپ کو ہر ماہ 1000 الفاظ مفت میں نقل کرنے دیتا ہے۔ سبسکرپشن کی قیمت $10 فی مہینہ یا $100 فی سال ہے۔ کمپنی اپنے سب سے زیادہ فعال صارفین کو ایپ کے ساتھ استعمال کرنے کے لیے ایک فزیکل شارٹ کٹ ڈیوائس بھی بھیجتی ہے جسے مونوکی کہتے ہیں۔
کی بورڈز 1983 کے ہیں۔ ہم Monologue کو مفت سالانہ سبسکرپشن کے ساتھ 10 دے رہے ہیں۔ pic.twitter.com/nXuz1ll2LU
Superwhisper بنیادی طور پر ایک ڈکٹیشن ایپ ہے، لیکن یہ آڈیو یا ویڈیو فائلوں سے بھی نقل کر سکتی ہے۔ ایپ آپ کو AI ماڈلز کا انتخاب اور ڈاؤن لوڈ کرنے دیتی ہے، بشمول Nvidia کے Parakeet اسپیچ ریکگنیشن ماڈلز کے ساتھ، مختلف رفتار اور درستگی کی سطحوں پر اس کے اپنے کئی ماڈلز۔
ایپ آپ کو آؤٹ پٹ کو چلانے کے لیے حسب ضرورت اشارے لکھنے کی بھی اجازت دیتی ہے، اور آپ اپنے سسٹم کی بورڈ سے براہ راست پروسیس شدہ اور غیر پروسیس شدہ دونوں نقلیں دیکھ سکتے ہیں۔
بنیادی آواز سے متن کی خصوصیت استعمال کرنے کے لیے مفت ہے، اور آپ کو پرو خصوصیات جیسے ترجمہ اور نقل کی جانچ کرنے کے لیے 15 منٹ ملتے ہیں۔ بامعاوضہ درجے کی مدد سے آپ اپنی خود کی AI API کیز استعمال کرسکتے ہیں اور کلاؤڈ اور مقامی ماڈلز کو بغیر کسی استعمال کے کیپس کے جوڑ سکتے ہیں۔
ماہانہ پلان کی قیمت $8.49 فی مہینہ ہے، سالانہ پلان کی قیمت $84.99 فی مہینہ ہے، یا آپ زندگی بھر کی رکنیت کے لیے $249.99 ادا کر سکتے ہیں۔
VoiceTypr ایپ ایک آف لائن-پہلے، بغیر سبسکرپشن کا طریقہ اختیار کرتی ہے، جس سے آپ کو ٹرانسکرپشن کے لیے مقامی ماڈل استعمال کرنے دیتا ہے۔ اس میں ان لوگوں کے لیے ایک GitHub ذخیرہ بھی ہے جو خود اوپن سورس ورژن کی میزبانی اور چلانا چاہتے ہیں۔ VoiceTypr 99 سے زیادہ زبانوں کو سپورٹ کرتا ہے اور میک اور ونڈوز دونوں پر کام کرتا ہے۔
ایپ تین دن تک مفت آزمانے کے لیے دستیاب ہے، اور اس کے بعد، یہ آپ کو تاحیات لائسنس خریدنے کی اجازت دے گی۔ ایپ کی قیمت ایک ڈیوائس کے لیے $35، دو کے لیے $56، اور چار ڈیوائسز کے لیے $98 ہے۔
Aqua Windows اور macOS کے لیے Y Combinator کی حمایت یافتہ صوتی ٹائپنگ ایپ ہے جو تاخیر کے لحاظ سے زمرہ کے تیز ترین ٹولز میں سے ایک ہونے کا دعویٰ کرتی ہے (آپ کے بولنے اور اسکرین پر متن ظاہر ہونے کے درمیان تاخیر)۔
گرائمر اور اوقاف کو سنبھالنے کے علاوہ، Aqua آپ کو فقرے کہہ کر ٹیکسٹ کو آٹو فل کرنے دیتا ہے — مثال کے طور پر آپ "میرا پتہ" کہہ سکتے ہیں اور Aqua سے اسے ٹائپ کرنے کے لیے کہہ سکتے ہیں۔ ایپ اپنی اسپیچ ٹو ٹیکسٹ API بھی پیش کرتی ہے، جس سے دیگر ایپس کو ایکوا کے ٹرانسکرپشن انجن میں پلگ ان ہونے دیتا ہے۔
مفت درجے میں آپ کو ماہانہ 1000 الفاظ ملتے ہیں۔ بامعاوضہ منصوبے $8 ماہانہ بل سالانہ سے شروع ہوتے ہیں اور لامحدود الفاظ اور 800 حسب ضرورت لغت کی اقدار کو غیر مقفل کرتے ہیں۔
Handy ایک اوپن سورس، مفت ٹرانسکرپشن ٹول ہے جو میک، ونڈوز اور لینکس پر چلتا ہے۔ ایپ کافی بنیادی ہے اور زیادہ حسب ضرورت پیش نہیں کرتی ہے، لیکن اگر آپ اپنی آواز کا زیادہ استعمال شروع کرنا چاہتے ہیں اور ادائیگی نہیں کرنا چاہتے تو یہ ایک اچھا آپشن ہے۔
ایپ میں بنیادی ترتیبات کا مینو ہے جو آپ کو پش ٹو ٹاک ٹوگل کرنے اور ٹرانسکرپشن کو چالو کرنے کے لیے ہاٹکی کو تبدیل کرنے دیتا ہے۔
Typeless اس کے اعلی مفت الفاظ کی گنتی کے لئے نمایاں ہے۔ کمپنی کا دعویٰ ہے کہ وہ کوئی ڈیٹا نہیں رکھتی ہے اور نہ ہی اسے AI ماڈلز کی تربیت کے لیے استعمال کرتی ہے۔ Typeless ان جملوں کو دوبارہ لکھنے کی بھی پیشکش کرتا ہے جو آپ نے بھڑکائے ہوں گے۔
ایپ آپ کو اپنے مفت درجے پر فی ہفتہ 4000 الفاظ (تقریباً 16000 الفاظ فی مہینہ) لکھنے دیتی ہے۔ آپ لامحدود الفاظ کو غیر مقفل کرنے اور نئی خصوصیات تک رسائی حاصل کرنے کے لیے ہر ماہ $12 ادا کر سکتے ہیں (سالانہ بل کیا جاتا ہے)۔ Typeless صرف Windows اور macOS کے لیے دستیاب ہے۔
VoiceInk میک کے لیے ایک اوپن سورس نجی ڈکٹیشن ایپ ہے۔ ایپ پش ٹو ٹاک موڈ کے ساتھ ساتھ اسٹارٹ/اسٹاپ ریکارڈ کرنے کے لیے عالمی شارٹ کٹس کو سپورٹ کرتی ہے۔ یہ اسکرین پر سیاق و سباق کو پڑھتا ہے اور اس کے مطابق اس کے آؤٹ پٹ کو ایڈجسٹ کرتا ہے۔
ایپ خود بخود کچھ ایپس اور یو آر ایل کا پتہ لگا سکتی ہے اور ہر ایک پر حسب ضرورت فارمیٹنگ یا قواعد لاگو کر سکتی ہے۔ اس میں ایک اسسٹنٹ موڈ بھی ہے جو آپ کے سوالات کا جواب دے سکتا ہے۔ ایپ کی قیمت ایک ڈیوائس کے لیے تاحیات رسائی کے لیے $25، دو ڈیوائسز کے لیے $39، اور تین ڈیوائسز کے لیے $49 ہے۔
ڈکٹیٹو میک کے لیے ایک ڈکشنری ایپ ہے جس کی قیمت €9.99 ہے — تقریباً $12 — جو آپ کو تاحیات رسائی اور فیچر اپ ڈیٹس کے دو سال فراہم کرتی ہے۔ ایپ Parakeet، Whisper، اور Apple Speech Analyzer جیسے آف لائن ماڈلز کے ساتھ کام کرتی ہے، اور ایپل انٹیلی جنس کو ہلکے پڑھنے اور فلر ورڈ ہٹانے کے لیے استعمال کرتی ہے۔ ان مقامی ماڈلز کی بدولت، ایپ انتہائی تیز رفتار 80ms لیٹنسی کا دعویٰ کرتی ہے، یعنی متن آپ کے بولنے کے فوراً بعد ظاہر ہوتا ہے۔
AudioPen ایک ویب پر مبنی صوتی نوٹ ایپ کے طور پر شروع ہوا، لیکن یہ سالوں میں تیار ہوا ہے۔ اس کا میک ورژن اب آپ کو متن کو ترتیب دینے اور اسے اپنے پسندیدہ فارمیٹ اور انداز میں دوبارہ لکھنے دیتا ہے، کسی بھی وقت مختلف طرزوں کے درمیان سوئچ کر کے۔ لائیو ٹرانسکرپشن کے علاوہ، آڈیو پین آپ کو تمام پلیٹ فارمز پر آڈیو نوٹس اسٹور کرنے، سمریوں کے لیے نوٹس کو یکجا کرنے، آڈیو فائلیں اپ لوڈ کرنے، اور AI کا استعمال کرتے ہوئے موجودہ نوٹوں کو دوبارہ لکھنے کی اجازت دیتا ہے۔ ایپ کی قیمت تین ماہ کے لیے $33، ایک سال کے لیے $99، اور دو سال کے لیے $159 ہے۔





