ویکیپدیا، فرمت فایل ویدیویی را بهعنوان یک حامل (Container) یا پوشش (Wrapper) تعریف میکند. در واقع این پوشش یک فرمت متافایل است که مشخصات آن، نحوه ذخیرهسازی و کدگذاری دیتا و متادیتا را مشخص میکند.
بهعبارت سادهتر، وقتی به یک فایل چندرسانهای نگاه میکنید، متوجه خواهید شد که نام فایل با پسوندی مانند mov، avi، mp4 و... تمام میشود. این پسوندها در واقع فرمت فایل ویدیویی را نشان میدهند.
برای مشاهده ادامه خبر به ادامه مطلب مراجعه کنید
اساسا ویدیوها در حاملهای تلفیقکننده اطلاعات یا فرمتهای پوشانندهای بستهبندی میشوند که تمام اطلاعات مورد نیاز برای ارایه ویدیو را در خود نگهداری میکنند.
ویدیوها
داری انبوهی از اطلاعات بسیار متفاوت هستند که میتوانند در داخل این
حاملها بستهبندی شوند. این اطلاعات میتوانند شامل مواردی مانند جریان
ویدیو، جریان صدا، متادیتا، زیرنویس، اطلاعات فصلهای ویدیو، اطلاعات
هماهنگسازی و... باشند. برای آنکه جریانهای دیتای چندرسانهای در قالب
ذخیرهشده یا انتقال یافته خود مفید باشند، باید با یکدیگر در یک فرمت حامل
تلفیق شوند. شما میتوانید فرمتهای فایل ویدیویی را بهعنوان جعبههایی
در نظر بگیرید که تمام این اطلاعات را در خود جا میدهند (بسیار شبیه به
کاری که یک فایل Zip یا Rar انجام میدهد).
کدکها و فشردهسازی ویدیویی
با
وجود آنکه فرمتهای حامل فرآیند فشردهسازی را برای کاهش حجم تمام منابع
اطلاعاتی مختلف در یک فایل فشرده انجام میدهند، اما پیش از بستهبندی این
اطلاعات، هر جریان دیتا بهطور جداگانهای کدگذاری/فشردهسازی میشود. به
این ترتیب، شما میتوانید یک جریان ویدیویی را با استفاده از کدک H.264 و
یک جریان صوتی را با استفاده از الگوی فشردهسازی AAC کدگذاری کنید. این
ترکیب سپس میتواند در یک فایل حامل mov بستهبندی شود.
بهعنوان یک قاعده کلی، هرچه نرخ بیت بر ثانیه (مقدار اطلاعات در هر ثانیه که برای ارایه محتوای ویدیویی و صوتی لازم است) در یک فایل ویدیویی بیشتر باشد، کیفیت بهدست آمده از آن بهتر خواهد بود. بخش دیگر این معادله، به نحوه فشردهسازی و بسط اطلاعات مربوط میشود، زیرا بعضی از الگوهای فشردهسازی بهتر از سایرین هستند. فشردهسازی اطلاعات اساسا بر الگوریتمهایی برای خارج کردن بخش از دادهها با هدف کوچکتر کردن یک قطعه بزرگ از اطلاعات انجام میشود. انجام درست اینکار، کیفیت خوب ویدیویی را حفظ کرده و در عین حال فضای کمتری را اشغال میکند که بهخصوص برای تحویل ویدیو روی وب از اهمیت بالایی برخوردار است.
یک
کدک (Codec که ترکیبی از دو عبارت Coder/Decoder است)، مجموعهای از
دستورالعملها را در بر میگیرد که شیوه مورد استفاده برای فشردهسازی
دادهها در تعداد کمتری از بایتها را مشخص میکنند. کدک در عین حال انجام
فرآیند مذکور در هنگام پخش مجدد یک فایل ویدیویی را نیز بر عهده دارد و آن
را از حالت فشرده خارج میکند. بنابراین، یک کدک ویدیویی در واقع یک الگوی
کدگذاری یا فشردهسازی است که یک جریان ویدیو را فشردهسازی میکند، در
حالیکه یک کدک صوتی همین کار را برای یک جریان صوتی انجام میدهد.اجازه بدهید به چند مثال از الگوهای فشردهسازی و کدگذاری دادههای مختلف اشاره کنیم:
- ویدیو: H.264، H.263، VP6، Sorenson Spark، MPEG-4، MPEG-2 و...
- صدا: AAC، MP3، Vorbis و...
- متادیتا: XML، RDF، XMP و...
باید
توجه داشته باشید که کدکها بهطور کلی به دو گروه تقسیم میشوند: حذفی
(Lossy) و غیرحذفی (Losseless). در واقع عملکرد این کدکها دقیقا به همان
صورتی است که از نامشان برداشت میکنید. فشردهسازی حذفی که معمولا برای
تحویل دادههای چندرسانهای مورد استفاده قرار میگیرد، باعث میشود که
بخشی از دادههای اصلی در طول فرآیند فشردهسازی و بسط مجدد از دست بروند،
اما از سوی دیگر فایلهایی با اندازههای بسیار کوچکتر را تولید میکند.
فشردهسازی غیرحذفی، تمام اجزای اطلاعات را بدون هیچ کم و کاستی در طول
فرآیند فشردهسازی و بسط حفظ میکند، اما فایلهای تولید شده با این روش به
اندازه روش حذفی کوچک نیستند.
بعضی
از فرمتهای ویدیویی نیاز دارند که از فرمتهای حامل بهخصوصی استفاده
کنند و بعضی از فرمتهای حامل نیز خاص فرمتهای ویدیویی معینی هستند. برای
مثال، فایلهای MPEG-2 PSم (MPEG-2
Program Stream) از یک حامل خاص استفاده میکنند که بهطور کلی با پسوند
MPEG یا MPG شناخته میشود. با وجود آنکه امکان استفاده از فرمتهای حامل
دیگری نیز برای این فایلها وجود دارد، اما تقریبا همهجا از حامل
استاندارد آنها استفاده میشود.
خواندن جریانهای مختلف از یک فرمت حامل
برای
آنکه امکان پخش هماهنگ جریانهای متفاوت (مانند ترکیبی از ویدیو و صدا)
بهوجود آید، این جریانها در لابهلای یکدیگر قرار میگیرند (Interleaved)
تا الزامی برای خوانده شدن کامل آنها پیش از پخش وجود نداشته باشد. شکل
(2) یک جریان ویدیوی واحد را نشان میدهد که با دو جریان صوتی و یک جریان
زیرنویس ترکیب شده است. به منظور رندر جریانهای مختلف برای پخش، ابتدا
باید آنها را با نرمافزار ویژهای از یکدیگر جدا کرد. برای فایلهای AVI و
MPEG-2 PS، این عملکرد در داخل ویندوز جاسازی شده است. در مورد سایر
فرمتهای حامل، این کار معمولا توسط فیلترهای DirectShow اداره میشود که
توسط نرمافزارهای مختلف پخش و Encoderها روی سیستم عامل شما نصب شدهاند.
شکل 2
در بعضی از موارد مانند MP4، ممکن است مجبور شوید خودتان نرمافزار خاصی را با این عملکرد به سیستم اضافه کنید.شما در ادامه با مجموعهای از فرمتهای حامل و فرمتهای ویدیویی بههمراه مشخصات و ویژگیهای متمایز کننده آنها آشنا خواهید شد:
AVI
فرمت فایل AVI که نام آن مخفف عبارت Audio Video Interleave است، با پسوند avi. شناخته میشود. این فرمت، یک حالا خاص از فرمت RIFF(م Resource Interchange File Format)
بهشمار میآید. فرمت AVI، صدا و ویدیو را در یک فایل حامل واحد و
استاندارد ترکیب میکند تا امکان پخش هماهنگ آنها را فراهم سازد.
همانطور که اشاره کردیم، AVI یک فرمت حامل است، به این معنی که ویدیو و
صدای فشردهسازی شده با تنوع بسیار گستردهای از کدکها را در خود نگهداری
میکند. بنابراین در حالی که سایر فرمتها تنها میتوانند انواع معینی از
فشردهسازی را در خود جا دهند، فرمت فایل ویدیویی AVI میتواند دادههای
صوتی و ویدیوی را تقریبا با هر الگوی فشردهسازی نگهداری کند. با وجود
آنکه فایلهای AVI از بیرون کاملا شبیه یکدیگر به نظر میرسند، اما
میتوانند از نظر داخلی تفاوتهای بسیار زیادی داشته باشند.
فرمت
حامل AVI در سال 1992 توسط تیم توسعه ویدیو برای چارچوب چندرسانهای
ویندوز در مایکروسافت ایجاد شد. این فرمت از زمان معرفی خود به یک
استاندارد غیررسمی برای فرمتهای ویدیو و صدا تبدیل شده و این موقعیت را در
طول چند دهه حفظ کرده است. اکثر سایتهای وبی که ویدیوهایی را برای
دانلود ارایه میکنند، از این فرمت برای فایلهای خود بهره میگیرند. فرمت
AVI دادههای جریان ویدیوی و صوتی را بهصورت یک درمیان نگهداری میکند
تا امکان پخش هماهنگ آنها را فرام کند. این فرمت به یکی از اولین
فرمتهای صنعت PC تبدیل شد که به پذیرش جهانی دست پیدا کردند. فرمت AVI از
جریانهای متعدد داده صوتی و ویدیویی پشتیبانی میکند، یک ویژگی که
بهندرت مورد استفاده قرار میگیرد.
همانطور
که اشاره کردیم، فرمت AVI قادر است از جریانهای متعدد دادههای صوتی و
ویدیوی پشتیبانی کند (شبیه به فرمت حامل VOB در DVDهای ویدیویی). از نظر
فنی، فرمت AVI تقریبا منسوخ شده است زیرا سربار داده قابل توجهی دارد که
باعث میشود اندازه فایل بهطور غیرضروری بزرگ شود. این فرمت در عین حال از
ویژگی فریمهای B در فرمتهای مدرنی ماند MPEG4 پشتیبانی نمیکند. از سوی
دیگر، فرمت حامل AVI قادر است کدک بسیار کارامد H.264 را نگهداری کند، هر
چند که بهخاطر نیاز به اعمال هکهای فشردهسازی بهعنوان یک روش مناسب
در نظر گرفته نمیشود. با وجود این محدودیتها، فرمت AVI همچنان محبوبیت
خود را برای بهاشتراک گذاشتن فایلهای ویدیوی حفظ کرده است زیرا از
قابلیت انتقال بسیار خوبی در بین نرمافزارهای تدوین ویدیویی برخوردار
است. نصب فیلترهای ffdshow در DirectShow وWindows
Media Player غالبا میتواند مشکلات ناسازگاری را برطرف سازد. در حال
حاضر با وجود آنکه فرمت AVI هنوز در ویندوز پشتیبانی میشود و برای
فرمتهایی مانند DV بسیار مناسب است، اما بهعنوان یک فرمت حامل
همهمنظوره خوب در نظر گرفته نمیشود.این
فرمت بهخاطر برخورداری از مزیت معماری ساده خود، روی سیستمهای گوناگونی
مانند ویندوز، مک، لینوکس و یونیکس پخش میشود و اکثر مرورگرهای وب مشهور
نیز از آن پشتیبانی میکنند.
MPEG
فرمت ویدیوی MPEG یک فرمت فایل است که توسط گروهMoving
Picture Experts Group توسعه یافت. این فرمت یک استاندارد فشردهسازی
بینالمللی برای تصاویر متحرک است که برای ایجاد دیسکهای VCD، SVCD و DVD
مورد استفاده قرار میگیرد. در حال حاضر، سه استاندارد فشردهسازی MPEG-2،
MPEG-1 و MPEG-4 در این خانواده بهطور گستردهای مورد استفاده قرار
میگیرند. بهعلاوه، استانداردهای MPEG-7 و MPEG-21 نیز در حال توسعه
هستند. فرمتهای فایل ویدیوی MPEG دارای پسوندهای mpg. و dat. هستند، در
حالیکه فایلهای صوتی مبتنی بر این کدک عموما با پسوندهای mp2، .mp1. و
mp3. شناخته میشوند.Moving
Picture Experts Group یکی از گروههای کاری ISO/IEC است. اولین جلسه رسمی
این گروه در سال 1988 برگزار شد و تا سال 2008 با یک رشد نمایی بیش از 380
عضو را در بر گرفته بود. فرمت فشردهسازی MPEG-1 در سال 1993 توسط این
گروه توسعه یافت، در حالی کهMPEG-2 در سال 1995 برای استفاده در DVD-ROM معرفی شد. استانداردMPEG-3
برای تلویزیونهای HDTVطراحی شده بود و MPEG-4 نیز در سال 1998
استانداردسازی شد. MPEG-7 یک مجموعه ابزار برای تشریح کامل حتوای
چندرسانهای را فراهم میکند، اما MPEG-21 استانداردی به شمار میآید که
نحوه تشریح محتوا و همچنین پردازشهای مربوط به دسترسی، جستوجو،
ذخیرهسازی و محافظت از محتوای دارای حق کپی را تعیین میکند.
مزیت
اصلی فرمت MPEG در مقایسه با سایر فرمتهای کدگذاری صوتی و ویدیویی،
اندازه بسیار کوچکتر فرمتهای فایل MPEG برای یک کیفیت مشابه است. برتری
مذکور به این واقعیت مربوط میشود که فرمت MPEG از یک تکنیک فشردهسازی
بسیار پیشرفته استفاده میکند. این فرمت از الگوریتمهای فشردهسازی حذفی
بهره میگیرد که دادههای اضافی در بین تصاویر متوالی را حذف کرده و در عین
حال بیشتر بخشهای مشابه را حفظ میکند تا دادههای اضافی را کاهش دهد.
در واقع فرمت MPEG برای اینکه به نرخ فشردهسازی بالای خود دست پیدا کند،
تنها تغییرات ایجاد شده مابین فریمهای متوالی را بهجای دادههای کامل
هر فریم ذخیره میکند. اطلاعات ویدیویی سپس با استفاده از تکنیکی که
(Discrete Cosine Transform) DCT نام دارد کدگذاری میشوند.بسیاری
از کارتهای ویدیویی که امروزه برای مصرفکنندگان عام در بازار وجود
دارند، به تراشههای مجهز شدهاند که کار کدگذاری و کدگشایی MPEG را
بهصورت سختافزاری شتابدهی میکنند تا امکان ضبط و پخش این فایلها بدون
از دست دادن فریمها آنها را فراهم کنند. البته کدکهای نرمافزاری بسیار
متنوعی نیز برای این منظور ارایه شدهاند که در موارد مختلفی مورد
استفاده قرار میگیرند، با اینحال، روش نرمافزاری کاملا بر پردازنده
اصلی سیستم شما متکی خواهد بود. اگر کامپیوتر شما به یک پردازنده قدرتمند
چند هستهای مجهز باشد، مشکلی با این موضوع نخواهید داشت.
دوستان عزیز لازم به ذکراست که این مطلب آموزشی دارای 3بخش مختلف هستش انشاالله درچندروز آینده قسمت های بعدی در وبلاگ قرار خواهد گرفت
باتشکر
مدیریت وبلاگ