PDA

مشاهده نسخه کامل : همه چيز درياره Mpeg-4



Security
11-04-07, 11:47
آيا MPEG-4 آخرين تكنولوژى چندرسانه‏اى است كه همگان انتظار آنرا مى‏كشيدند؟ بياييد با هم نگاهى به آن بيندازيم تا بفهميم اين تكنولوژى چگونه روش اجرا و انتقال فايلهاى چندرسانه‏اى را تحول بخشيده است؟

Multimedia (چندرسانه‏اى)؛ كلمه‏اى كه اولين بار پس از ظهور كليپهاى ويدئويى كوتاه روى كامپيوترها بر سرزبانها رواج يافت. آن روزها اين كلمه خيلى عجيب مى‏نمود اما امروزه كلمه و عبارتى بسيار معمول شده است.

تمام امكانات چندرسانه‏اى PC شما تنها صوت و ويدئو نيست؛ اما استفاده از تمام پتانسيل چندرسانه‏اى كامپيوترها فعلاً كمى دور از واقعيت است. DVD كامپيوتر را تبديل به يك دستگاه خانگى براى اجراى ويديو كرد، اما هنوز توانايى فرستادن فايلهاى چندرسانه‏اى (كه اغلب هم حجيم هستند) از طريق شبكه‏ها روى PCها و دستگاههايى مانند تلفنهاى همراه كمى با مشكل مواجه است.

تكنولوژى جديدى كه قول داده اجرا و انتقال چندرسانه‏اى‏ها را روى شبكه متحول گرداند، با نام MPEG-4 شناخته مى‏شود. شايد اين تكنولوژى قالب كلى چندرسانه‏اى را براى دستگاهها و برنامه‏هاى كاربردى خاصى بهبود بخشد.

گروه متخصصين تصاوير متحرك (MPEG يا Moving Picture Experts Group) كميته‏اى است كه استانداردهاى محتويات چندرسانه‏اى‏ها را تعريف و تعيين مى‏كند. اين كميته از صدها محقق و مهندس از سرتاسر دنيا تشكيل شده است. MPEG استانداردهاى صوتى و تصويرى MPEG-1 و MPEG-2 را كه نقشى اساسى در پيشرفت چندرسانه‏اى خصوصاً براى PCها بازى مى‏كرد را تعريف كرده و توسعه داد. آخرين دستاورد اين گروه با نام MPEG-4 دريچه‏اى رويايى به روى كاربران تكنولوژى‏هاى قبلى اين گروه گشود.

MPEG-4 ابتدا به عنوان يك استاندارد بين‏المللى (با نام رسمى ISO/IEC 69441) در اكتبر 1998 تصويب شد. MPEG چند تابع و عملكرد جديد به اين تكنولوژى اضافه كرد و دومين نسخه MPEG-4 را كه رسماً در دسامبر 1999 معرفى شد، بوجود آورد. نسخه دوم كاملاً با نسخه اول خود سازگار است.

استانداردهاى MPEG نبايد به عنوان يك موفقيت در بهبود تكنولوژيها ديده شود؛ هركدام از اين استانداردها هدفى را برآورده مى‏كنند كه براى آن طراحى شده‏اند، نه بيشتر و نه كمتر.

MPEG-1 بوجود آمد تا ويدئوهاى با كيفيت VHS را روى پهناى باندى به اندازه 150 كيلوبايت در ثانيه (سرعتى برابر با يك درايو 1X CD) كه در آن زمان سرعت معمول بود، پخش كند. MPEG-2 تكنولوژى مشابهى است كه براى پهناى باندهاى بالاتر بوجود آمد. هدف اصلى اين تكنولوژى برنامه‏هاى ديجيتال تلويزيونى و همچنين DVDها بود. MPEG-2 كيفيت تصويرى بهترى نسبت به MPEG-1 دارد چون از پهناى باند بيشترى استفاده مى‏كند.

فرمت صوتى MP3 كه بسيار هم محبوب است، قسمتى از MPEG-1 Audio مى‏باشد كه نام آن از ، MPEG-1 Audio Layer3 برداشته شده و از الگوريتمهاى فرانهوفر استفاده مى‏كند. MPEG-3 هم هرگز وجود نداشته، بلكه نام گذارى از MPEG-2 به MPEG-4 جهش داشته است.

تمام استانداردهاى MPEG به فشرده‏سازى اطلاعات ويدئويى و صوتى ديجيتال كمك مى‏كنند، پس مى‏شود به طور مؤثرى از اين استانداردها بهره برد. MPEG-4 هم همين كار را انجام مى‏دهد، اما قدرت فشرده‏سازى آن بسيار بيشتر از استانداردهاى قبلى است. اما MPEG-4 يك جهش كوانتومى به سمتى است كه با اشياء موجود در تصاوير با يك حس واحد برخورد نشود. به عبارت ديگر MPEG-4 همانند زبان برنامه‏نويسى C++، شى‏ءگرا (Object Oriented) است. تصويرى كه بيننده آنرا به شكل يك كليت واحد مى‏بيند مى‏تواند به صورت چندين جزء مشخص و جداگانه درنظر گرفته شود كه به طور يكپارچه در كنار هم جمع شده‏اند. اين خصيصه پهناى باند كمترى اشغال مى‏كند و MPEG-4 را هم برخلاف تكنولوژيهاى قبلى، Interactive مى‏سازد.
طراحى كاملاً متفاوت شى‏ءگرا:

استانداردهاى قبلى MPEG طبق ايده‏اى پايه‏گذارى شد كه در آن ايده فايلهاى صوتى و تصويرى كلاسيك (يك پنجره مستطيلى از ويدئو كه با صوت يا Soundtrack همراه بود) به يك فرم ديجيتال تبديل شوند كه حجم آن بقدر كافى كم بوده و با توجه به تكنولوژيهاى روز، تصوير و صوت از وضوح قابل قبولى برخوردار باشند. برداشت MPEG-4 از مفهوم شى‏ء (Object) به يك فايل چند رسانه‏اى اجازه مى‏دهد كه به قطعات كوچكتر و ساده‏ترى به نام «ويدئو» و «صوت» شكانده شوند، بنابراين مى‏توان اين قطعات را براى ساختن صحنه‏هاى جديد به كارگرفت. بخشهاى مختلف صوت و ويدئو مى‏توانند با Objectهاى مستقل درگير شده و تداخل كنند.

ديگر اينكه MPEG-4 تعريف اشياء را فراتر از صداها و ويدئوهاى ساده و مسطح مى‏برد. اشياء مى‏توانند به صورت Textureهاى شما در برنامه‏هاى سه بعدى، Render شوند. چهره‏هاى تركيبى (Synthetic)مى‏توانند به صورت Animation درآمده و توسط يك برنامه Text-to-speach (مثل MS-Talk It) صداگذارى شوند. صداها را مى‏توان به جاى اجراى دوباره، Synthesize (تركيب) كرد. MPEG-4 هركدام از اينها را به عنوان يك شى‏ء درنظر مى‏گيرد كه مى‏توان آنها را دستكارى (Manipulate) كرد و مستقل از يكديگر در صحنه‏هاى فيلم‏ها قرارداد.
جريانهاى رودخانه‏اى:

MPEG-4 طراحى شده است تا محتويات صوتى و تصويرى به صورت مستمر (درست مثل جريان آب يك رودخانه) اجرا و پخش شوند. با افزايش پهناى باند موجود براى استفاده، بازار رسانه‏هاى مستمر (Streaming) نيز گسترش يافته است. MPEG-4 براى مستمرسازى روى اينترنت، پخش توسط شبكه‏هاى تلويزيونى ديجيتال، انتقالات بى‏سيم و يا حتى خواندن از روى يك CD بسيار مناسب است. اين استاندارد مستقل از روش انتقال (Delivery Method) مى‏باشد.

ساختار داخلى MPEG-4 رامى‏توان به صورت رشته‏هاى مستمر مختلف درنظر گرفت كه براى انتقال با هم تركيب (Multiplex) شده و روى دستگاه سرويس گيرنده يا Client (كه مى‏تواند يك PC يا يك تلفن همراه باشد)، Demultiplex مى‏شوند تا رشته‏هاى مشخص بتوانند به صورت يك فايل چندرسانه‏اى به هم بچسبند. بلوك اصلى ساختمان رشته‏هاى ES (Elementary Stream) ، MPEG-4 مى‏باشد. يك ES ممكن است تراك صوتى يك فيلم باشد. ES در يك OD (يا Object Descripter) بسته مى‏شود؛ يك ES واحد در يك OD اساسى‏ترين «شى‏ء» در طراحى شى‏ءگراى MPEG-4 مى‏باشد.

ممكن است شيئى كه توسط OD تعريف مى‏شود شامل بيش از يك ES باشد. براى مثال شى‏ء "Soundtrack" مى‏تواند شامل چندين رشته صوتى به زبانهاى مختلف باشد. زبان مناسب مى‏تواند توسط شخص Client انتخاب شود.

MPEG تصور مى‏كرد MPEG-4 راهى است كه باعث توزيع آسان محتويات چندرسانه‏اى روى دستگاههاى Client با قابليتهاى مختلف شود. يك كامپيوتر متصل به اينترنت با يك Modem كابلى و يك تلفن همراه كه از طريق يك Modem بى سيم Dial-up (شماره‏گيرى) مى‏كند، از نظر قدرت پردازش و پهناى باندى كه در اختيار آنها است تفاوتهاى كاملاً محسوسى دارند. MPEG-4 به سازندگان چندرسانه‏اى‏ها اجازه مى‏دهد يك موجوديت (Entity) چندرسانه‏اى مفرد بسازند كه هر دو دستگاه بتوانند به آن دسترسى داشته باشند.

يك روش كه توسط آن به اين مهم دست مى‏يابيم، طراحى رشته‏هاى مستمر مى‏باشد. براى مثال يك OD ممكن است شامل چندين نسخه از يك كليپ ويدئويى باشد كه تحت Bit Rateهاى مختلف ضبط شده‏اند. هنگامى يك Client ويدئو را درخواست مى‏كند، OD اطلاعاتى درباره امكاناتش تهيه مى‏كند تا بتواند رشته ويدئويى را به صورت مستمر در دسترس قرار دهد. قابل توجه‏تر اينكه MPEG-4 مى‏تواند به طور پويا رشته‏ها را تغيير اندازه دهد (Scale كند) تا تحت شرايطى بتواند اين استمرار را اداره كند.
ويدئوى MPEG-4:

اولين تجربه اكثر كاربران با MPEG-4، استفاده از قابليتهاى ويدئويى اين استاندارد مى‏باشد. اساسى‏ترين Coding فيلم ويدئويى توسط MPEG-4 (كه بر پايه DCT بنا گذاشته شده است) انجام مى‏شود ( DCT در استانداردهاى قديمى MPEG به كار گرفته مى‏شد). Compressor فريمهاى متوالى ويدئو را فشرده كرده و سعى در حذف اطلاعات زايد دارد.

در انواع قديمى فشرده‏سازى چندرسانه‏اى‏ها، فريم اصلى‏ترين واحد فشرده‏سازى ويدئو بود. MPEG-1 و MPEG-2 با حذف اطلاعات اضافى درون يك فريم و اطلاعات زايد بين فريمها، عمل فشرده‏سازى را انجام مى‏دهند. براى مثال هنگامى كه «خلاصه اخبار» تلويزيون ضبط مى‏شود، اين ويدئو يك پس‏زمينه تقريباً ثابت و تغييرناپذير دارد. اين پس‏زمينه از فريمى به فريم ديگر تغيير آنچنانى نخواهد داشت، بنابراين Compressor/Decompressor) CODEC، نرم‏افزار يا سخت‏افزارى كه داده‏ها را فشرده يا غيرفشرده مى‏كند) تنها تفاوت بين فريمها را ذخيره مى‏كند. پس‏زمينه ثابت هم اطلاعات نسبتاً كمى براى ذخيره دارد. نواحى با رنگ و روشنايى يكسان در يك فريم هم مى‏توانند مانند JPEG(تصاويرى كه هنوز روى وب به كار گرفته مى‏شوند) فشرده شوند. هرچند اين تكنيكها ويدئو را به طور اساسى فشرده مى‏كنند، اما اغلب بلوكهايى حجيم هم بوجود مى‏آورند (خصوصاً وقتى كه نواحى با رنگ يكسان پشت سرهم تكرار شوند). اين مشكلات روى پهناى باندهاى پايين تشديد مى‏شوند.

فشرده‏سازى مبتنى بر فريمها به طور ضمنى سعى مى‏كند بين پس‏زمينه ثابت و پيش‏زمينه متحرك تفاوت قائل شود. MPEG-4 هم مى‏تواند اين كار را انجام دهد، به شما اين امكان را هم مى‏دهد كه اجزاء ويدئو را به طور صريح (و نه ضمنى) از يكديگر جدا كنيد. MPEG-4 مى‏تواند پس‏زمينه ثابت و پيش زمينه را به عنوان اشياء جداگانه‏اى درنظر بگيرد كه توسط دستگاه Client به طور يكپارچه با يكديگر Merge (تركيب) مى‏شوند. در مثال «خلاصه اخبار تلويزيونى» شما قسمت كوچكى از كل تصوير كاملاً متحرك است، در نتيجه پهناى باند لازم كاهش مى‏يابد. پس‏زمينه ثابت مى‏تواند تنها در هنگام نياز Update شود (مثلاً پس از نمايش نقشه هواشناسى، تصاوير اخبار پخش شود) و مى‏توان آنرا واضحتر نشان داد چون پس زمينه به جاى اينكه در جريان فيلم حركت كند مى‏تواند به طور جداگانه كنترل و Handle شود و به همين طريق نيز در الگوريتم فشرده‏سازى به كار گرفته شود.

ويدئوى MPEG-4 برخلاف پيشينيانش چيزى فراتر از Coding فيلم ويدئويى شما است. البته محتويات مركب ويدئو (مثل يك اتومبيل طراحى شده با كامپيوتر) را مى‏توان توسط MPEG-1 و MPEG-2 هم فشرده كرد و يا به صورت فايل درآورد اما در اين حالت ويدئوى شما ابتدا Render مى‏شود و سپس شبيه انواع ديگر ويدئو به صورت ترتيبى از فريمها تبديل مى‏شود. MPEG-4 عمل Render كردن را توسط Decoder انجام مى‏دهد.

به طور مثال، در فيلم «اخبار» (يك شى‏ء ويدئويى طبيعى)، گوينده مى‏تواند پشت يك ميز طراحى شده توسط كامپيوتر بنشيند. پارامترهاى اين ميز به صورت رشته‏هاى MPEG-4 هستند و ديكودر اين رشته‏ها را كنار يكديگر مى‏چيند و شكل «ميز» را توليد مى‏كند. پارامترهاى ميز مى‏تواند شامل Texture آن باشد (فرض كنيد ميز يك نماى چوب گردويى دارد) تا تصوير واقعيتر به نظر بيايد. اين اعمال درست شبيه روندى است كه محيطهاى 3D براى خلق بازيهاى ويدئويى از آن استفاده مى‏كنند: يك Texture (مثل چادر سفيد يك شبح) روى مدلى از شبح نگاشت (Map) مى‏شود. MPEG-4 از اشياء مركب 2D و 3D پشتيبانى كرده و مى‏تواند روى هر دو Texture بپوشاند. همچنين مى‏تواند اشياء را متحرك (Antimate) كند. براى متحرك سازى يك مدل لازم است داده‏هاى خيلى كمى تبادل شوند، پس اين نوع متحرك سازى بسيار مناسب براى اتصالات شبكه‏اى با سرعت پايين است.

MPEG-4 كمكهاى شايانى براى دو مورد بسيار ويژه از مدلهاى مركب درنظر گرفته است: صورت و بدن انسان. MPEG-4 يك مدل كلى از صورت را در خود دارد كه سازندگان ويدئو كافى است براى صحبت كردن و حركت اين صورت آنرا كمى دستكارى كرده و حتى يك Texture به آن اختصاص دهند. صورت همانند يك شى‏ء سه بعدى كلى به داده‏هاى خيلى كمى براى متحرك شدن نياز دارد. اين داده‏ها مى‏توانند لبها را طورى حركت دهند كه اگر با يك مكالمه Sync شود، درست همانند صورت كسى است كه صحبت مى‏كند. متحرك سازى بدن هم همين گونه است. مى‏توانيد فرم كلى بدن را به دلخواه تغيير دهيد و حركتهاى بدن را توسط يك رشته بيتى كنترل كنيد.

كاربرد اشياء سه‏بعدى و پيش‏بينى شرايط Interaction (عمل متقابل ويدئو) با كاربر (كه هر دو نمونه‏هايى از VRML هستند) به MPEG-4 اجازه مى‏دهند كه محيطهاى سه‏بعدى قابل هدايت ايجاد كنند. در يك صحنه 3D، زاويه ديد كاربر هم يك شى‏ء است. بسته به اينكه صحنه چگونه ساخته شده، ممكن است كاربر قادر باشد زاويه ديد را تغيير دهد (مثل دور صحنه «پرواز كند») يا زاويه ديد را از بين چند زاويه انتخاب كند. يك خريدار Online مى‏تواند در يك فروشگاه مجازى كه پر از مدلهاى سه‏بعدى از اجناس است به دنبال ملزومات خود بگردد و توسط يك راهنماى انيميشن اجناس خريدارى شده را در سبد خريد خود بگذارد (اين سبد خريد هم مجازى است).

هدف MPEG-4 از ايجاد يك رشته واحد داده‏اى قابل دسترس توسط دستگاههاى مختلف، وقتى رويايى مى‏شود كه با ويدئو همراه شود؛ مسلماً ويدئو رسانه‏اى است كه هم به پهناى باند و هم به پردازش بيشترى نياز دارد. تكنيكهاى استانداردى كه ويدئو را در پهناى باند از محدوده زير 64 كيلوبيت بر ثانيه تا 10مگابيت بر ثانيه پخش مى‏كنند، پديده‏هايى رو به پيشرفت هستند. چندين استراتژى در خدمت اين كار هستند كه رشته‏هاى ويدئويى را Scale (كوچك و بزرگ) كنند تا مناسب با پهناى باند و قدرت پردازش باشد.

MPEG-4 مانند اكثر تكنولوژيهاى فشرده‏سازى ويدئو مى‏تواند به طور پويا وضوح تصوير را Scale كرده و در هر ثانيه تعداد كمترى فريم براى پهناى باندهاى كوچكتر بفرستد، در نتيجه ويدئو با Soundtrack خود هماهنگ (Synchronized) مى‏ماند. همچنين مى‏تواند به طور ديناميك وضوح فاصله‏اى (Spatial) را هم Scale كند تا MPEG-4 بتواند در هنگام كار با اشياء مركب Textureها را براى Decoderهاى ضعيف و يا پهناى باند محدود، فعال يا غيرفعال كند. سازندگان Game با اين استراتژى آشنا هستند، چون در اكثر Gameهاى 3D كاربر مى‏تواند درجه وضوح Texture را تغيير دهد تا بين كيفيت تصوير و سرعت فريمها تناسب ايجاد شود.
گوش كنيد: صداى MPEG-4 مى‏آيد

صوت و ويدئو هميشه همراه يكديگر هستند، و طبعاً MPEG-4 هم ابزارهايى براى كار با صوت درنظر گرفته است. صداى طبيعى با كيفيت بالا توسط ابزار General Audio Coding كنترل مى‏شود كه اين ابزار هم از يكى از تكنولوژيهاى MPEG-2 به نام Advenced Audio Coding(يا AAC) مشتق شده است. صداهاى پنج كاناله كه ممكن است با يك ويدئوى حجيم همراه باشد بايد توسط AAC كد شود. MPEG-4 اين توانايى را دارد كه به طور پويا كيفيت صدا را كاهش يا افزايش دهد تا كاربر بتواند بر مشكلاتى نظير پهناى باند پايين و محدوديت Decoder غلبه كند. صوت با استفاده از تكنيكى به نام Bit-Sliced Arithmatic Coding (BSAC) مى‏تواند Encode شود تا Bit Rate را به اندازه يك كيلوبيت بر ثانيه برساند. اين تكنيك جهت تنظيمات دقيق رشته‏هاى صوتى براى به كارگيرى ديناميك همه منابع سيستمى در دسترس بسيار مناسب است. MPEG-4 تكنولوژيهاى بهينه مخصوصى جهت Coding صداهاى انسانى با Bit Rate كم دارد.

تكنيك Harmonic Vector eXcitation Coding (HVXC) طراحى شده تا كار در محدوده 2 تا 4 كيلوبيت برثانيه را راحتتر كند و حتى مى‏تواند با سرعت متوسط 2/1 كيلوبيت بر ثانيه كار كند (البته به شرطى كه بتوان Bit Rate را تغييرداد). اين Bit Rateهاى پايين بسيار مناسب شرايطى مثل پهناى باندهاى بسيار محدود مثل اتصالات ماهواره‏اى مى‏باشد. يك تكنيك ديگر Coding به نام Code Excited Linear Prediction (CELP) جهت Bit Rate هاى 4 تا 24 كيلوبيت بر ثانيه بوجود آمده و براى اتصالات شبكه‏اى سيار فعلى بسيار مناسب است. انتقال BitRateهاى خيلى پايين صوتى (200 بيت تا 2/1 كيلوبيت در ثانيه) كار با ماجولهاى TTS (Text-to-Speech) را ممكن مى‏سازد. MPEG-4 ماجول TTS خاصى را مشخص نمى‏كند، اما رابط TTS (يا TTSI) را در اختيار مى‏گذارد. ماجول TTS براى سازگارى با TTSI بايد به نوعى تطبيق داده شود. اطلاعات درباره جنس، سن و الگوهاى گفتارى شخص سخنگو به TSSI فرستاده مى‏شود تا يك فايل صوتى خاص از يك شخص بوجود بيايد. تكنولوژى TTS كه با مدل ظاهرى MPEG-4 تلاقى يافته، مى‏تواند صداى صحبتها را در يك جريان داده‏اى بسيار كوچك نگهدارى كند.

همانطور كه MPEG-4 اجازه خلق اشياء مركب ويدئويى را به شما مى‏دهد، شما هم مى‏توانيد همين كار را باصداهاى مركب انجام دهيد. ابزار Structured Audio به شما اجازه مى‏دهد "Instrument"ها را با يك Score كنترل كنيد ( Instrument به ويژگيهاى صداهاى Download شده مى‏گويند نه صداهايى كه از قبل روى دستگاه بوده‏اند. در واقع اين صداها به صورت رشته‏هاى صوتى دريافت شده و سپس Mergeمى‏شوند). با اين ابزار مى‏توان صداهاى موسيقايى پرحجم را با پهناى باند كم انتقال داد.

مى‏دانيم MPEG-4 روى فضاى سه‏بعدى تأكيد دارد، پس جزئيات استانداردى هم وجود دارند كه مشخص مى‏كنند صدا را چگونه مى‏توان در يك فضا قرارداد. اندازه، شكل و ويژگيهاى آكوستيكى فضا و محل قرارگيرى منبع صوتى در اين فضا مى‏تواند يك صداى آكوستيك سه بعدى بوجود آورد.
همه را با هم امتحان كنيد:

MPEG-4 انواع مختلف تكنولوژيها را براى اشياء تعريف كرده است. مثلاً Binary Format for Scenes(BIFS) زبانى است كه براى تشريح چگونگى نسبت بين صحنه و اشياء به كار مى‏رود. BIFS نسخه باينرى فرمت متنى است كه توسط Virtual Reality Modeling Language (VRML) به كار مى‏رود. VRML براى خلق محيطهاى 3D استفاده مى‏شود كه در اين محيطها مى‏توان توسط يك مرورگر وب جابه جا شد. اما MPEG-4 برخلاف VRML مى‏تواند همينطور كه اطلاعات مى‏رسند،صحنه را Render كند (به جاى اينكه قبل از شروع Render ابتدا همه اطلاعات را به طور كامل Download كند كه اين كار سرعت كار را بسيار پايين مى‏آورد).

اشياء گروههاى BIFS در يك وراثت، متكى بر نسبت بين صحنه و اشياء هستند. براى نمونه، صداى گوينده اخبار و تصوير ويدئويى بايد با هم در يك گروه باشند و به طور مناسب جلوى صحنه هواشناسى قرار بگيرند. صحنه Static نيست؛ ممكن است در همين حين كه دستورات BIFS از طرف Server مى‏رسند، صدا و تصوير گوينده اخبار در صفحه جابه جا شوند.
امكانات جذاب:

ويدئو، صوت و Interaction در قلب استاندارد MPEG-4 هستند. اداره چنين پيچيدگى روى Decoder مى‏تواند كار سختى باشد. MPEG-4 يك سيستم برنامه‏نويسى مبتنى بر Java به نام MPEG-j تعبيه كرده تا Media Playerهاى MPEG-4 را منعطف‏تر كند. يك برنامه MPEG-jمانند رشته (Stream) هاى مستمر به Decoder فرستاده مى‏شود. پس از اين انتقال، مى‏توان برنامه را براى دستكارى عناصر صحنه و يا بهينه‏كردن Interactivity به كاربرد. برنامه مى‏تواند گزارشهايى از قابليتهاى Decoder و منابع تغيير سيستمى تهيه كند و طبق آن در فرستادن رشته‏هاى مناسب به Encode كمك كند.

امروزه مديريت حقوق - ويژگيها (Property-rights) يكى از موارد مهم در دنياى ديجيتال است. MPEG-4 رشته‏ها را توسط اعداد منحصربه فردى برچسب مى‏زند كه اين اعداد هم متعلق به Property Holderها هستند؛ پس مديريت حقوق - ديجيتال امن هم ممكن است. اطلاعات حقوق همزمان با Metadataهاى ديگر رشته ذخيره مى‏شود ( Meta data اطلاعات مشخصه و ديگر داده‏هاى تشريحى است)، نتيجه اين مى‏شود كه ديگر لازم نيست براى تشخيص Owner يك رشته، كل رشته از Server گرفته شود. MPEG-4 يك مدل مشخص براى مديريت حقوقها تعريف نمى‏كند، اما در عوض رابطى تعبيه مى‏كند كه به Owner محتويات اجازه ايجاد يك راه‏حل مديريتى براى نيازهاى خاص مى‏دهد.
Profileها:

MPEG-4 استانداردى بسيار جامع و فراگير است. تاكنون هيچ نوع Media Player بوجود نيامده كه تمام امكانات آنرا پياده‏سازى كرده باشد. مثلاً يك تلفن همراه به صداى پنج كاناله نياز ندارد يا گرافيكهايى را كه به Render كردن نياز داشته باشد پشتيبانى نمى‏كند. بنابراين اين استاندارد تعدادى پروفايل تعريف مى‏كند كه اين پروفايلها حاوى ويژگيهايى هستند كه محدوده قابليتهاى يك Decoder را تعيين مى‏كنند. يك پروفايل مى‏تواند به چند Level تقسيم شود. وظيفه هر Level محدودكردن پيچيدگى محاسباتى است كه Decoder بايد درون پروفايل آنرا كنترل و اداره كند.

پروفايلها زيرمجموعه‏هايى از مجموعه ابزارهاى MPEG-4 را مشخص مى‏كند. پروفايلهاى موجود عبارتند از پروفايل بصرى، صوتى، گرافيكى، گراف صحنه‏اى و توصيف‏كننده شى‏ء. به عنوان نمونه، اساسى‏ترين پروفايل بصرى براى تصاوير ويدئويى طبيعى، پروفايل Simple است. اين پروفايل، ويدئوى مستطيلى شكل خطاناپذير براى دستگاههاى كند و باپردازنده ضعيف (مثل تلفن همراه) در اختيار مى‏گذارد. سه سطح اين پروفايل، حداكثر Bit Rate و ديگر جنبه‏هاى رشته‏هاى ويدئويى را مشخص مى‏كند تا بتواند منابع Decoder را درخواست كند. پروفايلها در قسمتى از روشهاى وراثتى سازماندهى شده‏اند تا پروفايل بعدى در زنجيره كلاً با محتويات طراحى شده براى دستگاهى با قابليتهاى كمتر، سازگار باشد.

پروفايلها و Levelها به طراحان اجازه مى‏دهند پياده‏سازى MPEG-4 خود را سازگار سازند. يعنى يك Audio Player محصول يك شركت خاص كه از پروفايل صوتى Scalable در سطح 3 پشتيبانى مى‏كند با يك Player از شركت ديگر كه ويژگيهاى پروفايل و Level آن مشابه اولى است، سازگار خواهد بود. سازگار بودن اعمال و توابع پياده سازيهاى MPEG-4 به توافق كمپانيهاى مختلف بستگى دارد.
MPEG-4 تنها يك Vaporware نيست:

MPEG-4 چيزى فراتر از اين گفته‏ها و ناگفته‏ها است. تعدادى از محصولاتى كه از اين تكنولوژى استفاده مى‏كنند در بازار يافت مى‏شوند و محصولات قويترى هم در راهند.

بعضى از كمپانيها هم بيكار ننشسته و از اين تكنولوژى سوء استفاده مى‏كنند. مثلاً Napster ويدئوهايى را كه به طريق غيرقانونى روى سايت خود پخش مى‏كند، توسط تكنولوژى MPEG-4 فشرده كرده است.

DivXNetworks يك Codec با تكنولوژى MPEG-4 به نام DivX طراحى كرده كه قفل نرم‏افزارى DVD را (كه با MPEG-2 فشرده شده) مى‏شكند و DVD را فشرده‏تر مى‏كند. DivXNetworks با بهبودبخشيدن به مديريت حقوق - ديجيتال و همكارى نزديك با كمپانيهاى پيشرو در زمينه MPEG-4 پيشرفت قابل توجهى در Mainstreamها داشته است.

Codec رايگان DivX5.0 و مجموعه 30 دلارى DivX Pro براى مشتاقان ويدئوى ديجيتال به عنوان ابزارهاى كليدى هستند.

DivXNetworks با همكارى Sigma Designs يك كارت PCI با خروجى كد شده توسط DivX به نام REALmagic xCArd طراحى كرده و ساخته‏اند.

xCard و نرم‏افزار همراه آن قابليت كار با ساختارهاى ويدئويى DVD، VCD، MPEG-1 و MPEG-2 و MPEG-4 را دارد. اين كارت مجهز به خروجيهاى Composite و S-Video براى اتصال به تلويزيون است و يك كنترل از راه دور هم به همراه دارد.اين كارت خروجيهايى هم براى صدا دارد و از صداهاى Dolby Digital Surroundپشتيبانى مى‏كند. اگر كامپيوتر و تلويزيون شما نزديك يكديگر قرار دارد با اتصال اين دو به يكديگر توسط xCardمى‏توانيد يك سيستم سرگرم كننده قوى در منزل خود داشته باشيد.

قول MPEG-4 در مورد اين موضوع كه چند رسانه‏اى‏ها را روى سيستمهاى دستى و تلفنهاى همراه منتقل خواهد كرد، توسط كمك پردازنده تصويرى IMAGEON001 محصول ATI به واقعيت پيوست. اين تراشه در يك Package كوچك و كم مصرف براى استفاده روى سيستمهاى سيار، امكانات گرافيكى پيشرفته‏اى ارائه كرده كه شامل وضوح تصويرى و عمق رنگ بالاتر، بافركردن فريمها و شتابدهنده سخت‏افزارى جهت انجام Decompression مى‏باشد.

Panasonic هم در لباس الكترونيكى (E-wear) مدل SV-AV01 كه يك MP3 Player با قابليت ضبط و پخش است، ويدئوهاى MPEG-4 با ظرفيت پايين را نيز اجرا مى‏كند.
جاده‏اى در پيش راه؛ عريض و با كمى دست‏انداز:

MPEG-4 آمده تا نقش گسترده‏اى در دنياى چندرسانه‏اى‏ها و پخش آنها روى Platformهاى گوناگون بازى كند. اين تكنولوژى همانند ديگر تكنولوژيهاى MPEG يك Open Standard است؛ يعنى هر كسى مى‏تواند از آن استفاده كند. به هر حال MPEG LA يكى از شركتهاى قانونى اما مستقل از MPEG طرحى ارائه داده كه طبق آن هزينه‏اى به عنوان MPEG-4 Licensing Fee دريافت شود: يك شارژ دقيقه به دقيقه براى دريافت رشته‏هاى MPEG-4. حاميان MPEG-4 مثل Apple (كه قابليتهاى MPEG-4 را در نرم‏افزار QuickTime تعبيه كرده) در كار دشوارى با يكديگر همگام مى‏شوند.

اين تكنولوژى مبتنى بر Open Standard براى كاربران خانگى خيلى جذاب است، چون اگر يك كمپانى محصول راضى كننده‏اى ارائه ندهد رقباى ديگرش محصولى بهتر به بازار مى‏فرستند. اين آزادى انتخاب كاربران رقابتى سالم بين توسعه‏دهندگان MPEG-4 بوجود آورده است. در گذشته اين توسعه دهندگان هزينه License تكنولوژى MPEG را (كه تنها يك بار دريافت مى‏گردد) پرداخته‏اند. كمپانيهاى درگير با MPEGتاكنون پول زيادى صرف توسعه اين استاندارد كرده‏اند و انتظار دارند عوض آنرا دريافت كنند. اگر توسعه دهندگان بتوانند با اين هزينه‏ها كنار بيايند و از كاربران اين محصول توقع مادى زيادى نداشته باشند، مى‏توان با جرأت گفت كه MPEG-4 در آينده‏اى نزديك يك فرمت رسانه‏اى جهانى خواهد شد.

شركتهاى پيشرو در عرصه MPEG-4 :

Apple Computer, Inc.: Only the registered members can see the link (Only the registered members can see the link)

ATI Technologies, Inc.: Only the registered members can see the link (Only the registered members can see the link)

DivXNetworks, Inc.: Only the registered members can see the link (Only the registered members can see the link)

amp; Only the registered members can see the link (Only the registered members can see the link)

MPEG LA: Only the registered members can see the link (Only the registered members can see the link)

Panasonic: Only the registered members can see the link (Only the registered members can see the link)

Sigma Designs, Inc.: Only the registered members can see the link (Only the registered members can see the link)