استخراج زیرنویس ها از DVD
نام نرم افزار: Avidemux نسخۀ نرم افزار: 2.4 اگر بخواهید که فایل های زیرنویس (subtitle files) را از یک DVD استخراج کنید، باید کمی راجع به چگونگی کارکرد آنها اطلاع داشته باشید. زیرنویس ها در هرDVD همانند جریان ()stream های مربوط به صدا و تصویر، بخشی از محتویات فایل هایVOB هستند. لغت stream از این جهت در این جا مورد استفاده قرار می گیرد که بتوانیم بین فایلی که دارای انواع اطلاعات است و اصطلاحاً Self contained یا جامع نامیده می شود و یک stream تفاوت قائل شویم. یک فایل می تواند دارای چندینstream باشد. زیرنویس هایی که شما در یک DVD مشاهده می کنید،stream های فایلهای تصویری هستند که یکی پس از دیگری در مقابل چشمان شما ظاهر می شوند. هر یک از این stream ها زبان متفاوتی را به نمایش می گذارد. زمانیکه stream های زیرنویس ها را از یک DVD استخراج می کنیم، مناسبترین فرمت برای ذخیرۀ آنها فایل متنی (text file) است که حاوی "کد زمانی" (time code) لحظه ای است که متن مربوط به آنها در صفحه ظاهر می شود. اگر فایل زیرنویسی که در اختیار شما قرار می گیرد، به جای فرمت تصویری به صورت متنی باشد، ویرایش و ترجمه اش آسان تر خواهد بود. فایل را به راحتی می توان از طریق اینترنت ارسال نموده و یا در وب سایت دلخواه جهت دانلود شدن توسط دیگران قرار داد. برای اینکه یک فایل زیرنویس متنی (text-based subtitle file) ایجاد کنیم، میتوانیم فایلهای تصاویر مربوطه را ازDVD به دو صورت استخراج کنیم: 1- یک فایل با پسوند "*.idx" که دارای کد زمانی زیرنویس تصویر است(اصطلاحاً آنرا فایلVobSub می نامند). 2- و یک فایل با پسوند "*.sub " که حاوی اطلاعات تصویریاست. محتویات این فایل ها را سپس می توان به یک فایل زیرنویس مبتنی بر متن(متنی) تبدیل نمود. فرمت های متفاوت بسیاری برای این امر وجود دارد که Avidemux از میان آنهاسازگارترین را که فایل دارای پسوند "*.srt" است، انتخاب می نماید. توجه: تصاویری که جهت واضح ترشدن توضیحات این بخش در ادامه ارائه می شوند، ترکیبی از تصاویر مربوطه در سیستم عامل های (Linux(Ubuntu و Windows می باشند. Avidemux تحت هردوی این سیستم عامل ها به خوبی اجرا می شود و واسط کاربر آن به جز در برخی موارد تفاوت رنگ ظاهری، مشابه می باشد.
استخراج بصورت فایل idx/VobSubدر منوی "Tools" واقع در کادر بالای صفحۀ Avidemux ، گزینه VOBàVobSub را انتخاب نمایید.
آنگاه باید تصویر زیر را مشاهده نمایید که از شما در مورد یافتن سه نوع فایل(ها) سوٌال می کند: 1- فایل (های) VOB 2- فایل IFO 3- فایل VobSub
یافتن فایل VOBپس از آنکه برروی دکمهBrowse مقابل اولین کادر فشار دهید مرورگری ظاهر می شود که از طریق آن باید به جستجوی فایل های VOB بپردازید:
با این وجود، گاهی اوقات کاملاً مشخص نیست که این فایل هاکجا هستندد. فایل های موردنظر ما در شاخه ای در DVD قرار دارند کهVIDO_TS نامیده می شود(این مسئله در صورتی درست است که شما در حال استخراج فایل از یک DVD باشید). معمولاً برای یک فیلم کوتاه، تنها یک فایلVOB وجود دارد. برای فیلمهای طولانی، تعداد فایلهایVOB بیش از یکی است، ضمن اینکه در مورد حداکثر حجم این فایل ها نیز محدودیت هایی وجود دارد. حال نگاهی به ساختار نسبتاً پیچیدۀ فایل های یکDVD می اندازیم. در این میان فایلهای کوچکی وجود دارد که فایل های سیستمی و فایل های مورد استفاده برای منو می باشند- ما با این دسته از فایل ها سروکار نداریم. فایلهای تصویری، صوتی و زیرنویس که مدنظر ما هستند فایلهای بزرگی هستند. این فایل ها با نامهایی مثل VTS_02_1.VOB ، VTS_02_2.VOB ، VTS_02_2.VOB و VTS_02_4.VOB آغاز می شوند. چنانچه در جستجوی "فایلهای VOB" باشید، باید در شاخۀ VIDEO_TS به جستجو بپردازید، در این صورت تصویری مشابه زیر در مقابل چشمان شما ظاهر خواهد شد:
برای این تمرین می بایست اولین فایل بزرگ VOB را که در اینجا VTS_02_1.VOB نام دارد، انتخاب کنیم. فایلهایی که در پیامد آن می آید، بصورت خودکار انتخاب خواهند شد. پس از انتخاب فایل مناسب موردنظر برروی "Open" کلیک کنید:
یافتن فایل IFOاگر برروی دومین دکمه " Browse" کلیک کنید:
از شما خواسته می شود تا به جستجوی فایل هایی با پسوند " .IFO"بپردازید. فایل IFO فایلی است که حاوی اطلاعات مربوط به stream های زیرنویس های مختلف می باشد. چنانچه بیش از یک فایلIFO در DVD مزبور موجود باشد، باید فایلی را از میان آنها انتخاب کنیم که شروع نام ان مشابه نام فایل بزرگ VOB که قبلاً نشان کرده ایم، باشد. در این مثال نام فایلVOB موردنظر ما: VTS_02_0.IFO است. پس از یافتن این فایل و انتخاب آن، دکمه "Open" را فشار دهید.
انتخاب محل ذخیره فایل های VOBسومین دکمه Browse :
از شما برای انتخاب محل جهت ذخیره فایل VobSub پرسش می کند. پس از یافتن شاخۀ مناسب، نام فایل را در کادر مقابل "Name" تایپ نموده و مطمئن شوید که پسوند آن ".idx" است. مانند مثال زیر:
پس از انجام این عمل، و در صورتی که کادرهای دیگر کامل هستند، برروی دکمه "Save" کلیک کنید:
ذخیره فایلپس از آنکه همه فایل ها را یافته و به حالت انتخاب درآوردید، برروی دکمه "OK" فشار دهید تا پنجره کوچکی که قبلا ًبازه شده بود و دارای دکمه های کوچک است، بسته شود:
در ادامه پنجره ای ظاهر می شود که شما را از مدت زمان اجرای این مرحله مطلع می سازد:
زمانی که این مرحله به پایان رسید، یک فایل جدید با پسوند ".idx" و یک فایل جدید با پسوند ".sub" ایجاد کرده اید. این فایل ها در شاخه ای که برای ذخیره شدن فایل ".idx" انتخاب می کنید، ذخیره خواهند شد. در اینجا، من آنها را بررویdesktop ذخیره کردم:
ساخت فایل ".srt"حال می خواهیم فایل .idx و فایل .sub را به هم ملحق کنیم تا یک فایل ".srt" بوجود آید. در بالای صفحه برروی منوی "Tools" کلیک کرده و (VobSub->srt)OCR را انتخاب می کنیم:
در ادامه باید پنجره ای با عنوان "MiniOCR" ظاهر شود:
دکمه "Open" در زیر عنوان "VobSub" را فشار دهید. پنجره ای مشابه زیر با عنوان "VobSub Setting" باز می شود:
برروی "Select .idx" کلیک کرده و برای یافتن و انتخاب فایل idx که ایجاد کرده اید در قسمت "'Extracting to an idx / VobSub file " به جستجو بپردازید:
پس از آنکه فایل "idx" را انتخاب نمودید "Open" را فشار دهید. پس از آن می بایست به پنجره "VobSub Setting" بازگردانیده شوید:
اگر DVD را که برروی آن کار می کنید دارای بیش از یک زبان باشد، انواع آنها باید در کادر مربوط به منوی آبشاری "Select Language" به نمایش درآید. زبانی که می خواهید فایل زیرنویس برای آن ایجاد کنید، انتخاب نمایید:
پس ازآنکه زبان مناسب(موردنظر) را انتخاب کردید، دکمه "Ok" را کلیک کنید. به این ترتیب باید به پنجره "MiniOCR" بازگردانیده شوید. حال باید مکانی برای فایل*.srt برروی کامپیوترتان درنظر بگیرید. برروی دکمه "Save" در بخش "Output srt" کلیک کنید:
پنجره ای ظاهر می شود که از شما می خواهد شاخه ای را برای ذخیره فایلsrt درآن انتخاب کنید:
پس از آنکه مکان دلخواه را پیدا کردید، نامی را برای فایل در کادر مقابل "Name" تایپ کنید:
این نام می باید به پسوند ".srt" ختم شود. حال برروی "Save" کلیک نمایید:
حال که فایل های ورودی و خروجی را آماده نموده اید می توانید پروسه تبدیل فایل تصویری به فایل متنی را آغاز کنید. این پروسه اصطلاحاً OCR نامیده می شود. بنابراین در این مرحله برروی دکمه "Start OCR" فشار دهید:
سپس پنجره ای مشابه زیر دیده خواهد شد:
پروسهOCR (مخفف کلمات Optical Character Recognition ) نیاز به آن دارد که شما مشخص نمایید که چه کاراکترهایی(شامل حروف و اعداد بعلاوه علامت ها) در متن زیرنویس وجود دارد. برای این منظور، کاراکتری از یک زیرنویس تصویری برای شما به نمایش درخواهد آمد و شما باید مشخص کنید که کاراکترمتنی مربوط به آن چیست. Avidemux یک عبارت و یک کاراکتر از آن عبارت را مانند مثال زیر برای شما به نمایش خواهد گذاشت:
در ادامه، شما باید کاراکتر صحیح را در کادر متنی خالی مطابق تصویر زیر وارد نمایید:
انجام این کار برعهده شماست زیرا شناخت چنین کاراکترهایی توسط شما از دقت بالاتری برخوردار است نسبت به اینکه انجام آن توسط نرم افزار و بصورت حدس و گمان صورت پذیرد. درجایی که نوشته شده است "'Current Glyph Text": و تصویری از یک کاراکتر به نمایش درمی آید، باید آن کاراکتر را با استفاده از صفحه کلید در کادر واقع در زیر ان وارد کرده و دکمه "OK" را کلیک کنید. به خاطر داشته باشید که حروف بزرگ و کوچک در اینجا با یکدیگر تفاوت دارند و باید نسبت به این موضوع دقت لازم راداشنه باشید. علاوه بر این، در این پروسه گزینه "undo" (انصراف از عمل انجام شده) وجود ندارد، بنابراین مراقب باشید که حتی الامکان اشتباهی از شما سرنزند! گاهی اوقات دو کاراکتر برای شما نمایش داده می شود که باید هردوی آنها را در کادر مربوطه وارد کنید. به نظر می آید که پروسه مزبور بسیار طولانی شده است، اما به محض اینکه تمامی کاراکترها و اعداد موردنظر برنامه شناسایی شده و وارد شدند، سرعت برنامه افزایش می یابد. به عنوان مثال پروسه مربوط به یک فیلم 90 دقیقه ای می بایستی در حدود 10-5 دقیقه طول می کشد. پس از اتمام عملیات، فایل ".srt" که شما ذخیره نموده اید دارای کد زمانی صحیح و اطلاعات زیرنویس ها خواهد بود. این فایل را می توان توسط یک ویرایشگر متنی، باز نمود. در زیر نمونه ای از چنین فایلی را مشاهده می کنید: 1 00:00:10,991 --> 00:00:13,991 Man: Mick Jagger 2 00:00:18,565 --> 00:00:21,565 - Mick Jagger - Thank you 3 00:00:32,479 --> 00:00:35,479 - Man: Mick Jagger. - ( police radio squelch ) 4 00:01:04,778 --> 00:01:06,011 Man: one minute! one minute!
|