موضوع : تکنولوژی گوگل
توضیح: این فایل به صورت ورد و آماده چاپ می باشد
«جدا از مشكلات مقياس گذاري تكنيك هاي جستجوي قديمي، براي داده هاي به اين اندازه، تكنيك هاي جديد رقابتي كه استفاده از نمايش اطلاعات اضافي در فرا متن ها را براي نتيجة جستجوي بهتر شامل ميشود وجود دارد… خيزش سريع تكنولوژي براي جمع آوري مستندات وب و نگهداري آن ها بصورت بروز لازم و ضروري است. فضاي ذخيره سازي بايد به نحو موثري جهت ذخيرة ايندكس ها و مستندا تشان استفاده شود. سيستم indexing بايد صدها گيگابايت از داده ها را به شكل موثري پردازش كند. پرس وجوها بايد با سرعت صدتا هزار بار در هر ثانيه انجام شوند» سرجي برين ولاورنس پيج، 1997
در ابتدا BackRub وجود داشت، سرويسي كه به گوگل تبديل شد. امروزه گوگل با دقت بيشتري به الگوريتم pageRank خود وابسته است. PageRank الگوريتمي انتخابي است كه ارزش را به چيز مهمتر مي دهد. نشانگر اهميت يك صفحة وب تعداد صفحاتي است كه به آن صفحة خاص لينك مي شوند.
آقايان بِريِن و پِيچ خيلي زود فاكتور جديدي را به اين الگوريتم اضافه كردند كه رأي را به صفحة مهمتر مي داد. ايدة آنها اين بود كه صفحه اي مهمتر است كه تعداد افراد بيشتري بر روي آن كليك مي كنند.كليك هاي بيشتر روي يك صفحة وب باعث مي شد كه آن صفحه وب داراي ارزش و اهميت بيشتري شود. در انتها، آرام آرام فاكتورهاي ديگري نيز به اين الگوريتم اضافه شد. براي مثال ، تعداد دفعاتي كه محتواي يك صفحه تغيير
مي كند نيز يكي از فاكتور هاي مهم شد.
تكنولوژي pogeRank گوگل دقيقاً به جستجوي اينترنتي وابسته شده است. براي نمونه، الگوريتم رأي گيري(Voting Algorithm) كارايي كمتري در عمل جستجو دارد. توجهي كه گوگل نسبت به تكنولوژي جستجويش كرد، باعث تحت الشعاع قرار گرفتن افكار عمومي راجع به اين شركت شد. جستجوي گوگل همانند يك ستارة نوظهوراستكهدرخشندگياش باعث شده تا ناظران نتوانند جهات ديگر اين پديده را به وضوح و دقيق مشاهده كنند.
صرف نظر از اين ، گوگل يك شركت تكنولوژي است بعضي از اين تكنولوژي ها هنگامي كه دريك مقاله توضيح داده مي شوند مانند مقالة “The Anatomy of a Large –Scale Hypertextual” كه در همان اوايل مطرح شد، خواستار پيدا مي كنند. مقاله هاي اخير مانند
“MapReduce: Simplified Data search Engine" مي توانند به آرامي خوانده شوند با توجه به اينكه گوگل يك تكنولوژي است، توضيح دادن اينكه گوگل چكار مي كند، درجملات ساده وقابل هضم قدري مشكل است. شكل زير يك ديد كلي از چهار چوب گوگل را ارائه مي كند.
شكل 3-1: نمايي كلي از چهار چوب گوگل
مهمترين قسمت هاي تكنولوژي گوگل كه پايه و اساس دياگرام Googleplex است شامل موارد زير ميشوند:
[a]: اصلاح لينوكس به منظور اجازه دادن به فايل هاي بزرگ و ديگر توابع درجهت دادن شتاب بيشتر به همة سيستم
[b]: يك معماري توزيع شده كه به برنامه هاي كار بردي و مقياس بندي ها اجازه مي دهد كه بدون توجه به نوع آنها و بدون نياز به نصب سيستم عاملي ديگر به سيستم متصل شوند.
[c]: يك معماري فني كه در هر سطح مقياس بندي مشابه بهم هستند.
[d]: يك معماري مركزي وب، كه به انواع جديد برنامه هاي كاربردي، بدون محدوديت يك زبان برنامهنويسي اجازه مي دهد تا ساخته شوند.
تكنولوژي گوگل از يك پيشرفت پيوسته و يا آنچه كه مديران مشاور فني ژاپني به آن Kaizan مي گويند بوجود آمده است. هر تغيير تكنيكي گوگل ممكن است براي كاربران متوسط آن بي اهميت باشد اما زمانيكه بصورت كامل آن را تفسير مي كنند مزاياي فن شناسانة گوگل از ابداعات افزايشي و تصاعدي آن، سازگاري هوشمندانه و ماهرانة برداشت هاي پژوهشي – تحقيقي و تنظيم عالي بيزانس براي لينو كس حاصل ميشود. زماني، يك تاريخ نويس تكنولوژي ، از بين صدها پيشرفتي كه گوگل در اين نُه سال اخير آنها را رهبري كرده، قادر به تشخيص يك يا دو اختراع مهم كه برمبناي pageRank است خواهد بود. منتقدين گوگل در آينده خواهند ديد كه گوگل هستة پردازش تكنولوژي خود را با منابع مختلف پيوند زده است. جهت توضيح ، ساختار مراكز دادة گوگل و ارسال پيام به اين مراكز و از اين مراكز به جاهاي ديگر راههاي زيادي وجود دارد كه از طريق محاسبات شبكه اي صورت مي گيرد. توانايي گوگل در خواندن داده بصورت همزمان از كامپيوتر هاي مختلف ، يادآور تكنولوژي BiTorrent است. گوگل از سخت افزار مناسب يا “White box" در مراكز داده اش استفاده مي كند كه نشان دهندة خصلت كامپيوتر دوست بودن گوگل است. استفاده از حافظه و ديسك ها براي ذخيرة چنيدن كپي از داده ها ناشي از محدوديت هاي محاسباتي است.
گوگل به تكنولوژي دست يافت، سپس آنها را گلچين كرد و از راههاي مختلف نزديك شدن يك بلاك ساختمان، را به سيستم هاي با مقياس بزرگ نمايش داده گوگل از اين گلچين كردن و دسته بندي كردن سودهاي زيادي برد كه از آن جمله مي توان به اين موارد اشاره كرد: اولاً چهارچوب محاسباتي گوگل عملكرد سيستم را از سخت افزارهاي كم هزينه وبا قيمت نازل جدا كرد. دوماً، گوگل درمورد تنگناهاي سيستم عامل هايي از قبيل Solavis ، ويندوز سرور پيشرفته و لينوكس هاي آماده كاركرده است. سوماً ، گوگل ايده هاي برنامه نويسي خوبي از زبانهاي برنامه نويسي ديگر گرفته ، و توابع و كتابخانه هاي جديدي را جهت حذف بيشتر نيازهاي كدنويسي دستي براي موازي سازي يك برنامه كاربردي در سر تاسر سرورهاي گوگل پياده سازي كرده است.
طبق نظر جف دين كه يكي از مهندسان ارشد گوگل است، مهندسي گوگل ترتيبي از آشفتگي هاست. اين سخن نه شگفت انگيز است ونه لزوماً سخني منفي است. Googleplex جعبه اي است كوچك جهت برنامه نويسي و طراحي وابزارهاي آن پيچيدهوغيرطبيعي اند. مقابله با مشكلات گوگل را تبديل به مكاني براي بهترين و درخشنده ترين تكنيك هاي جهان كرده است. طبيعت خلاق با حركت گوگل تركيب شده و همين امر پيش گويي ابداعات بعدي گوگل را مشكل ساخته است. قبل از مرور دقيق تر قسمت هاي انتخاب شده از تكنولوژي گوگل ، دياگرام «چهارچوب محاسبات گوگل» مروري بر Googleplex و برخي از تكنولوژي هاي آن ايجاد مي كند و موضوع بحث اين فصل نيز راجع به همين مقوله خواهد بود.
Page Rank جهت كار كردن به مقدار زيادي سيكل محاسبات بر حسب اسب بخار نياز دارد. هنگاميكه گوگل در سال 1996 در حال پيشرفت بود آقايان برين و پيچ محاسبات را محدود كردند. براي اينكه pageRank كار كند، آنها مجبور بودند طريقة توليد الگوريتم pageRank را بر روي كامپيوترهاي معمولي و پيش پا افتادة موجود بفهمند. از ابتدا- و با توجه به تصادف پيشرفت تقريباً مسلم گوگل با مايكروسافت اين نتيجه مهم است- گوگل بايد مشكل مهندسي نرم افزار و سخت افزار خود را براي به موفقيت رسيدن جستجوها حل مي كرد. در حقيقت هنگاميكه راجع به تكنولوژي گوگل بحث ميكنيم خيلي مهم است كه در ذهن خود اين موضوع را داشته باشيم كه pageRank تنها به اين دليل مهم است كه مي تواند به سرعت دردنياي واقعي اجرا شود ونه در يك كامپيوتر بي بار ويا دريك آزمايشگاه روشن همراه با نور آبي سوپر كامپيوترها.
شكل تركيبي گوگل: مهندسي نرم افزار وسخت افزار نشان مي دهند كه چهار چوب تكنولوژي گوگل داراي دو ناحية فعاليت است. يك قسمت مهندسي نرم افزار است كه تلاش مي كند روي pageRank وديگربرنامههايكاربرديمتمركز شود.مهندسينرم افزاري كه در اينجا بكار رفته است به معناي نوشتن كد و فكر كردن دربارة اينكه چگونه يك سيستم كامپيوتري عمل كند تابيشترين سرعت عمل را داشته باشد است. سرعت عمل يعني زمان پاسخ گويي زير يك ثانيه ، كه گوگل قادر است علي رغم افزايش كاربران، برنامه هاي كاربردي و پردازش داده ها، آن را حفظ نمايد.
3-2:تركيب گوگل: نوآوري سخت افزار و نرم افزار
شكل 3-2: نماي تركيبي گوگل
قسمت ديگر برروي سخت افزار متمركز شده است. گوگل داراي رك هاي سرور، مكاني براي كابل ها، وسايل خنك كننده و لايههاي مراكز داده است. بازدهيازهزينههاي عملياتي پائين تر است و توانايي مقياس بندي، بعنوان درخواستي براي افزايش منابع محاسباتي است. با يك گردش سريع تر و حذف كارهاي پردرد سر همانند پشتيباني گرفتن از داده ها، ابداع سخت افزار گوگل، آن را به يك مزيت رقابتي تبديل كرده است كه بعضي رقباي آن مي توانند دراواسط سال 2005 با آن برابري كنند.
تكنولوژي گوگل
فهرست مطالبتكنولوژي گوگل 1
3-2:تركيب گوگل: نوآوري سخت افزار و نرم افزار 7
شكل 3-2: نماي تركيبي گوگل 7
3-3:چگونه گوگل از ياهو و MSN متمايز ميشود 10
چندين نگرش بصورت ضمانت شده هستند: 14
جدول 3-1: نظري كلي در مورد مسائل تكنيكي سه كمپاني ياهو، گوگل و مايكروسافت 19
نرم افزار 19
3-4:مقررات تكنولوژي 22
3-5:سخت افزار ارزان و نرم افزار هوشمند 23
3-6 :معماري منطقي 24
3-7 :سرعت و سپس سرعت بيشتر 28
جدول 3-2: اطلاعاتي درمورد خواندن داده ها از هارد درايوها در گوگل 29
جدول 3-3: اسامي سرورهايي كه از تكنولوژي گوگل استفاده مي كنند 32
عملكرد 32
Advertising Server 32
شكل 3-5: نمايش كاربرد سرويس نقشه و زمين در گوگل 34
3-8:حذف يا كاهش مخارج سيستم هاي معين 35
3-9:تصاويري لحظه اي از تكنولوژي گوگل 39
3-10:اشكالات Googleplex 42
3-11:رفتن خيلي سريع: تسريع كنندة وب گوگل 42
3-12:قانون هاي فيزيك : گرما و توان 101 43
3-13:ديگر مراكز دادة انتشار يافته 45
شكل 3-6: نمايي از درون يك مركز دادة گوگل 45
مشكلات شامل موارد زير هستند: 47
3-14:Sergey چيست؟ 47
3-15:پيش بيني نكردن نقص ها مي تواند نيروي مخرب گوگل را از خط خارج كند. 48
3-16:چكيدة ايرادهاي گوگل 49
3-17:اهرم بندي Googleplex 50