روشهای نوین بازیابی اطلاعات طبقه بندی ابزارهای جستجو (انواع و انواع آنها) ابزارهای جستجو را می توان به موارد زیر تقسیم کرد: - فهرست ها یا فهرست ها - فهرست ها - موتورهای جستجو

فیلم آموزشی: نحوه ایجاد پرس و جو در مایکروسافت اکسسدر 10 دقیقه

سخنرانی: استفاده از ابزارهای موتور جستجو (تشکیل پرس و جو)

مهمترین عملکردها هنگام کار با پایگاه داده فیلتر کردن اطلاعات، جستجو و پرس و جو است.


مرتب سازیفرآیند سازماندهی اطلاعات بر اساس برخی معیارها است. مرتب سازی صعودی و نزولی وجود دارد. اگر پایگاه داده داشته باشد اطلاعات عددی، پس از رتبه بندی به عنوان مرتب سازی استفاده می شود و اگر صحبت می کنیم اطلاعات متنی، سپس از مرتب سازی بر اساس حروف الفبا استفاده کنید.


هنگام در نظر گرفتن مرتب سازی بر اساس سیستم های مدیریت پایگاه داده در MS Access، مرتب سازی در یک فیلد واحد انجام می شود. اگر مرتب سازی جدیدی استفاده شود، نتایج قبلی آن از بین می رود. اگر مرتب‌سازی تودرتو است، می‌توانید آن را با استفاده از یک پرس و جو انجام دهید.


فیلتر کنید- این انتخاب اطلاعات لازم برای کاربر است. شما می توانید شرایط انتخاب پیچیده را تنظیم کنید.

برای یافتن برخی از داده ها، می توانید از کاراکترهای خاصی به نام استفاده کنید ماسک:


* – به این معنی است که می توانید هر تعداد کاراکتر را انتخاب کنید.

? - به جای این علامت می توان از هر نمادی استفاده کرد.

# - این نماد را می توان با هر عددی جایگزین کرد.

- هر کاراکتر داخل پرانتز

- - هر نماد مربوط به محدوده انتخاب شده.

! - هر کاراکتری به جز نویسه هایی که در پرانتز قرار دارند.

این فیلتر کاراکتر را می توان برای کل جدول یا برای بخشی از داده هایی که قبلاً با معیارهای خاصی انتخاب شده است استفاده کرد.

درخواست کنید- این تابع در مقیاس بزرگ است و می تواند هم مرتب سازی و هم فیلتر کردن را شامل شود. این تابع به شما امکان می دهد داده ها را در چندین فیلد و جدول انتخاب کنید. می توانید کتابخانه ای از پرس و جوها ایجاد کنید که برای استفاده در آینده ذخیره می شوند. یک زبان پرس و جو خاص SQL - ساختار یافته وجود دارد.

سخنرانی 4. ابزارهای بازیابی اطلاعات

به روز رسانی مداوم آرایه اطلاعات، همراه با افزایش حجم داده ها، در نظر گرفتن اسناد موجود و بر این اساس، جستجو را بسیار دشوار می کند، که می تواند به طور مشروط به موارد زیر تقسیم شود:

اهمیت مسئله بازیابی اطلاعات منجر به شکل گیری کل صنعت شده است که وظیفه آن دقیقا کمک به کاربر در جهت یابی در فضای مجازی است. این صنعت از ویژه تشکیل شده استخدمات جستجویا خدمات آنها به طور سنتی به موارد زیر تقسیم می شوند:

این گونه ها از نظر بصری بسیار شبیه هستند زیرا"هر دایرکتوری موتور جستجوی خود را دارد و هر موتور جستجو دایرکتوری مخصوص به خود را دارد". با این حال، اصول کار آنها بر اساس رویکردها و فناوری های کاملا متفاوت است. علاوه بر این، هر نوع سرویس جستجو برای حل یک مشکل خاص استفاده می شود. بازیابی اطلاعات شامل استفاده از استراتژی‌ها، روش‌ها، مکانیسم‌ها و ابزارهای خاصی است. رفتار کاربری که فرآیند جستجو را مدیریت می کند نه تنها با نیاز اطلاعات، بلکه با تنوع ابزاری سیستم - فناوری ها و ابزارهای ارائه شده توسط سیستم - تعیین می شود. انتخاب ابزار تا حد زیادی تعیین می شوداستراتژی جستجو و فناوری های جستجو

فن آوری های جستجو- توالی های یکپارچه (بهینه شده در یک سیستم بازیابی اطلاعات خاص) برای استفاده مؤثر از ابزارهای جستجوی فردی در فرآیند تعامل کاربر با سیستم.

با استفاده از فناوری های جستجوسیستم های اطلاعاتی را می توان به 3 دسته تقسیم کرد:

  • کاتالوگ های موضوعی و کاتالوگ های تخصصی (دایرکتوری های آنلاین).
  • موتورهای جستجو (جستجوی متن کامل)؛
  • ابزارهای جستجوی متا

کاتالوگ های موضوعیپردازش اسناد و انتساب آنها به یکی از چندین دسته را فراهم می کند که لیست آنها از پیش تعیین شده است. در واقع این برای همه کتابداران آشناستنمایه سازی مبتنی بر طبقه بندی. کاتالوگ های تخصصییا کتاب های مرجع برای صنایع و موضوعات خاص ایجاد می شوند.موتورهای جستجو(پیشرفته ترین ابزار جستجو در اینترنت) فناوری جستجوی متن کامل را پیاده سازی می کند. متون واقع در سرورهای درخواستی ایندکس می شوند.هنگام استفاده از وجوهمتاجستجو درخواست به طور همزمان توسط چندین موتور جستجو انجام می شود. نتیجه جستجو در یک لیست مشترک ترکیب می شود که بر اساس ارتباط مرتب شده است.

ابزارهای جستجو - مجموعه‌ای وابسته به هم از زبان‌های بازیابی اطلاعات و زبان‌های تعریف/مدیریت داده، که تحولات ساختاری و معنایی اشیاء پردازش (اسناد، فرهنگ‌های لغت، مجموعه‌ای از نتایج جستجو) را ارائه می‌کند.

1. دایرکتوری ها

ابزار جستجوی گروه اول، دایرکتوری های الکترونیکی هستند که ساختار سیستماتیک سلسله مراتبی یا منطقی- موضوعی مشخصی دارند.بسیار شبیه ساختار یک فهرست کتابخانه ای سیستماتیک. کار با کتاب‌های مرجع به شما این امکان را می‌دهد که منابع اینترنتی را در شاخه‌های دانش، عمیق‌تر رفتن از عمومی به خاص، تغییر شاخه‌های سلسله مراتبی، چند قدمی به عقب و غیره پیمایش کنید.

از جمله تحولات روسیه در این زمینه عبارتند از:

  • پورت (آدرس: www.aport.ru)،
  • List.ru (آدرس: list.mail.ru)،
  • لیست وب (آدرس: www.weblist.ru)،
  • ایوان سوزانین (آدرس: www.susanin.net)
  • حلزون (آدرس: www.ulitka.ru).

صفحه اصلی ویژگی متمایزکتاب های مرجع این است که آنها با دست ساخته شده اند. هیئت تحریریه هر یک از کتب مرجع کهماهیت کار شبیه بخش فهرست نویسی و نظام‌بندی کتابخانه‌های بزرگ است, به طور منظم محتویات سرورهای تازه پدیدار شده را بررسی کنید و تغییرات را در سرورهای موجود نظارت کنید. داده های شناسایی شده مطابق با طبقه بندی پذیرفته شده تجزیه و تحلیل و وارد بخش هایی از فهرست می شوند. توضیحات سرور به عنوان یک کل (یا بخش، اگر به نظر می رسد یک بلوک کاملا مستقل است) با یک حاشیه نویسی مختصر حاوی اطلاعات کلی در مورد ماهیت اطلاعات موجود ارائه شده است. در برخی موارد، اطلاعات اضافی در مورد زبان اسناد، ترافیک منابع، موقعیت فیزیکی آن و غیره وارد می شود.

پارامترهای اصلی که مزایای کتاب های مرجع را مشخص می کند عبارتند از:

  • حجم؛
  • کارایی انعکاس منابع جدید یا تغییر یافته؛
  • سازگاری و سازگاری طرح طبقه بندی سلسله مراتبی؛
  • ساختار متقابل

حجم دایرکتوری با درجه اطمینان آن تعیین می شود یا "قدرت اطلاعات". در برخی از سیستم ها، مکانیسم خاصی وجود دارد که به طور دوره ای در دسترس بودن یک سایت را بررسی می کند و اگر برای مدت طولانی "غیبت" از اینترنت باشد، آن را از لیست حذف می کند. ماهیت منطقی (علمی) طرح طبقه بندی مورد استفاده، میزان سهولت کاربران را در یافتن اطلاعات مورد نیاز تعیین می کند. سیستمارجاعات متقابلبه شما امکان می دهد اطلاعات را با استفاده از رویکردهای مختلف (به عنوان مثال، منطقه ای یا بخشی) شناسایی کنید. در این حالت، طرح طبقه بندی باید به طور خودکار کاربر را به شی مورد نظر هدایت کند، بدون توجه به اینکه کدام مسیر جستجو انتخاب شده است.

توانایی نوشتن پرس و جو برای این نوع ابزارهای جستجو نقش خاصی ندارد. جستجوهای پیچیده ای که نیاز به درخواست دقیق دارند با استفاده از کاتالوگ ها انجام نمی شوند.

دایرکتوری ها برای حل در نظر گرفته شده اندسه نوع کار:

  • جهت گیری در شاخه ای ناآشنا از دانش؛
  • جستجو برای اشیاء بزرگ، مانند، به عنوان مثال، سرورهای سازمان ها یا پروژه های مهم؛
  • به دست آوردن یک لیست آماده از منابعی که دارای یک تصویر جستجوی تار هستند (کتابخانه های یک نوع خاص، برنامه های حمل و نقل یا وب سایت های احزاب سیاسی و غیره)

مثال دیگر مقایسه یک فهرست منبع با فهرست سیستماتیک کتابخانه است که در آن فقط یک توضیح و حاشیه نویسی از یک کتاب (در این مورد، یک وب سایت کامل) باقی می ماند.

2. موتورهای جستجو

عملکرد سیستم های جستجو (موتورهای جستجو) بر اساس اصول تکنولوژیکی کاملا متفاوت است. وظیفه موتورهای جستجو ارائه یک جستجوی دقیق برای اطلاعات است که تنها از طریق حسابداری قابل دستیابی است.نمایه سازی ) محتوای حداکثر تعداد ممکن صفحات وب. برخلاف دایرکتوری ها، موتورهای جستجو در حالت خودکار کار می کنند و یک اصل عملیاتی یکسان دارند.

موتورهای جستجو دارای دو جزء اساسی هستند. جزء اول استبرنامه ربات ، که وظیفه آن انتقال از سروری به سرور دیگر و یافتن اسناد جدید (یا تغییر یافته) در آنجا و دانلود آنها است کامپیوتر اصلیسیستم ها ربات محتویات سند را اسکن می کند، پیوندهای جدیدی را هم به سایر اسناد روی سرور و هم به سایت های خارجی پیدا می کند. در مرحله بعد ، برنامه به طور مستقل پیوندهای مشخص شده را دنبال می کند ، اسناد جدیدی را پیدا می کند ، پس از آن روند دوباره تکرار می شود.یادآور «روش گلوله برفی» که در کتابشناسی به خوبی شناخته شده است. اسناد شناسایی شده توسط جزء دوم موتور جستجو پردازش (نمایه گذاری) می شوند. در این حالت، به عنوان یک قاعده، کل محتوای صفحه شامل متن، تصاویر، فایل های صوتی و تصویری در نظر گرفته می شود. تمام کلمات موجود در یک سند نمایه می شوند، که این امکان استفاده از موتورهای جستجو را برای جستجوهای دقیق در باریک ترین موضوعات فراهم می کند. تحصیل کردهفایل های فهرست ، ذخیره اطلاعات در مورد کلمه کلیدی مورد استفاده، چند بار، در کدام سند و در کدام سرور، پایگاه داده ای را تشکیل می دهد که توسط کتابدار که ترکیبی از کلمات کلیدی را در رشته پرس و جو وارد می کند به آن دسترسی دارد.

نتایج با استفاده از یک ماژول ویژه که تولید می کند، خروجی می شودرتبه بندی هوشمند نتایج . در این مورد موارد زیر در نظر گرفته می شود:

  • مکان عبارت در سند (عنوان، عنوان، متن اصلی)، فراوانی تکرار آن،
  • درصد از عبارت جستجو به متن صفحه،
  • تعداد و اعتبار لینک های خارجی به این صفحه از سایت های دیگر.

به پارامترهای اساسی موتورهای جستجوشامل:

  • تعداد سرورهای نمایه شده و اسناد فردی (حجم فایل های فهرست)؛
  • درجه کارایی به روز رسانی پایگاه داده با گنجاندن اطلاعات در مورد مواد جدید و حذف موارد منسوخ.
  • امکان ارائه درخواست؛
  • هوشمندی سیستم رتبه بندی نتایج جستجو؛
  • وجود توابع خدمات اضافی که کار کاربر را تسهیل می کند.

توانایی موتور جستجو برای بیان دقیق یک پرس و جو تا حد زیادی کیفیت نتایج به دست آمده را تعیین می کند. هر دستگاه واژگان خاص خود را دارد که به روش های مختلف جزئیات را امکان پذیر می کند.مشخصات جستجو.

همه موتورهای جستجو دارندماژول رتبه بندی نتایج جستجو. این دومین جزء اساسی همه سیستم ها است. فهرست عواملی که هنگام تعیین مکان یک سند در لیست پیوندها در نظر گرفته می شود به طور غیرعادی گسترده است: از مکان کلمه در صفحه تا رتبه (مرجع) صفحاتی که پیوندهایی به سند پیدا شده دارند.

  • گوگل (آدرس: www.google.com)،
  • AlltheWeb (آدرس: www.alltheweb.com)،
  • آلتا ویستا (آدرس: www.altavista.com).

ابزارهای جستجوی مشابهی در روسیه وجود دارد. همه آنها برای کار با اسناد روسی زبان طراحی شده اند و قدرتمند هستند http://www.metabot.ru).

نتیجه گیری در مورد موضوع بلوک سخنرانی

موتور جستجو مطابق با درخواست، صفحات را از پایگاه داده انتخاب می کند، سپس صفحات به ترتیب نزولی مطابقت ترتیب داده می شوند (یادداشت توسط A.A.)

در این مورد، تشابه مستقیمی با اصول عملکرد فهرست های کتابخانه های توزیع شده وجود دارد. فرصت کلیدیجستجوی متا توانایی ارسال درخواست های کاربر به طور همزمان به موتورهای جستجوی مختلف - با جمع بندی بعدی نتایج. (یادداشت A.A.)

وقتی به سراغ کتاب‌های مرجع می‌رویم، یک کتابدار می‌تواند انتظار دریافت کتاب‌های بسیار زیادی را داشته باشد اطلاعات عمومیبر اساس موضوع، و هرگز داده‌های جزئی: از سرور یک شرکت بزرگ حاوی هزاران صفحه، فهرست فقط شامل نام و چند خط حاشیه‌نویسی است.

1. مقدمه

هر سال حجم اینترنت به طور قابل توجهی افزایش می یابد، بنابراین احتمال پیدا کردن اطلاعات لازمبه شدت افزایش می یابد. اینترنت میلیون ها کامپیوتر، بسیاری از شبکه های مختلف را به هم متصل می کند و تعداد کاربران سالانه 15 تا 80 درصد افزایش می یابد. و با این حال، به طور فزاینده ای، هنگام دسترسی به اینترنت، مشکل اصلی کمبود اطلاعات مورد نظر شما نیست، بلکه توانایی یافتن آن است. به عنوان یک قاعده، یک فرد عادی، به دلیل شرایط مختلف، نمی تواند یا نمی خواهد بیش از 15-20 دقیقه را صرف جستجوی پاسخ مورد نیاز خود کند. بنابراین، یادگیری صحیح و شایستگی یک چیز به ظاهر ساده بسیار مهم است - کجا و چگونه برای به دست آوردن پاسخ های مورد نظر جستجو کنید.

برای پیدا کردن اطلاعات مورد نیاز، باید آدرس آن را پیدا کنید. برای این منظور، سرورهای جستجوی تخصصی (روبات های فهرست (موتورهای جستجو)، فهرست های اینترنتی موضوعی، سیستم های متا جستجو، خدمات جستجوی افراد و غیره) وجود دارد. این کلاس کارشناسی ارشد فناوری های اساسی برای جستجوی اطلاعات در اینترنت را نشان می دهد، ویژگی های کلی ابزارهای جستجو را ارائه می دهد و ساختارها را بررسی می کند. پرس و جوهای جستجوبرای محبوب ترین موتورهای جستجوی روسی زبان و انگلیسی زبان.

2. فن آوری های جستجو

فناوری وب شبکه جهانی وب (WWW) در نظر گرفته شده است تکنولوژی خاصتهیه و ارسال اسناد در اینترنت. WWW شامل صفحات وب، کتابخانه های الکترونیکی، کاتالوگ ها و حتی موزه های مجازی است! با چنین فراوانی اطلاعات، این سوال مطرح می شود: "چگونه در چنین فضای اطلاعاتی عظیم و بزرگی حرکت کنیم؟"
ابزارهای جستجو در حل این مشکل به کمک می آیند.

2.1 ابزارهای جستجو

ابزارهای جستجو ویژه هستند نرم افزارکه هدف اصلی آن ارائه بهینه ترین و باکیفیت ترین جستجوی اطلاعات برای کاربران اینترنت است. ابزارهای جستجو بر روی وب سرورهای خاصی میزبانی می شوند که هر کدام عملکرد خاصی را انجام می دهند:

  1. تجزیه و تحلیل صفحات وب و ثبت نتایج تجزیه و تحلیل در یک سطح از پایگاه داده سرور جستجو.
  2. جستجوی اطلاعات بر اساس درخواست کاربر
  3. ارائه رابط کاربری مناسب برای جستجوی اطلاعات و مشاهده نتایج جستجو توسط کاربر.

تکنیک‌های کاری که هنگام کار با یک ابزار جستجو استفاده می‌شود تقریباً یکسان است. قبل از بحث درباره آنها، اجازه دهید مفاهیم زیر را در نظر بگیریم:

  1. رابط ابزار جستجو در قالب یک صفحه با لینک ها، یک خط پرس و جو (خط جستجو) و ابزارهای فعال سازی پرس و جو ارائه می شود.
  2. شاخص موتور جستجو است پایگاه اطلاع رسانی، حاوی نتیجه تجزیه و تحلیل صفحات وب است که طبق قوانین خاصی گردآوری شده است.
  3. پرس و جو کلمه یا عبارتی است که کاربر در نوار جستجو وارد می کند. برای تشکیل پرس و جوهای مختلف، از کاراکترهای خاص (""، ~) و نمادهای ریاضی (*، +، ?) استفاده می شود.

طرح جستجوی اطلاعات در اینترنت ساده است. کاربر یک عبارت کلیدی را تایپ می کند و جستجو را فعال می کند، بنابراین مجموعه ای از اسناد را بر اساس درخواست فرموله شده (مشخص شده) دریافت می کند. این فهرست اسناد بر اساس معیارهای خاصی رتبه بندی می شود به طوری که در بالای لیست اسنادی قرار دارند که بیشترین مطابقت را با درخواست کاربر دارند. هر یک از ابزارهای جستجو از معیارهای مختلفی برای رتبه‌بندی اسناد استفاده می‌کنند، هم هنگام تجزیه و تحلیل نتایج جستجو و هم هنگام ایجاد یک فهرست (پر کردن پایگاه داده فهرست صفحات وب).

بنابراین، اگر برای هر ابزار جستجو یک پرس و جو با طرح مشابه در نوار جستجو مشخص کنید، می توانید نتایج جستجوی متفاوتی دریافت کنید. برای کاربر اهمیت زیادی دارد که کدام اسناد در دو تا سه دوجین سند اول در نتایج جستجو ظاهر می شوند و این اسناد چقدر با انتظارات کاربر مطابقت دارند.

اکثر ابزارهای جستجو دو روش جستجو را ارائه می دهند - جستجوی ساده(جستجوی ساده) و جستجوی پیشرفته(جستجوی پیشرفته) با یا بدون فرم درخواست خاص. بیایید هر دو نوع جستجو را با استفاده از مثال یک موتور جستجوی انگلیسی زبان در نظر بگیریم.

به عنوان مثال، AltaVista برای پرسش‌های دلخواه مفید است، «چیزی در مورد مدرک آنلاین در فناوری اطلاعات»، در حالی که ابزار جستجوی یاهو به شما امکان می‌دهد اخبار جهان، اطلاعات نرخ ارز، یا پیش‌بینی آب‌وهوا را دریافت کنید.

تسلط بر معیارهای اصلاح پرس و جو و تکنیک های جستجوی پیشرفته به شما امکان می دهد کارایی جستجو را افزایش دهید و به سرعت اطلاعات لازم را پیدا کنید. اول از همه، می توانید با استفاده از عملگرهای منطقی (عملیات) یا، و، نزدیک، نه، ریاضی و و کارایی جستجوی خود را افزایش دهید. شخصیت های خاص. با استفاده از عملگرها و/یا نمادها، کاربر در ارتباط است کلمات کلیدیدر ترتیب مورد نیاز برای دریافت مناسب ترین نتیجه جستجو برای درخواست خود. فرم های درخواست در جدول 1 نشان داده شده است.

جدول 1

یک درخواست ساده تعداد معینی لینک به اسناد می دهد، زیرا ... این فهرست شامل اسنادی است که حاوی یکی از کلمات وارد شده در طول درخواست یا یک عبارت ساده است (جدول 1 را ببینید). عملگر و به شما امکان می دهد تعیین کنید که تمام کلمات کلیدی باید در محتوای سند گنجانده شوند. با این حال، ممکن است تعداد اسناد همچنان زیاد باشد و بررسی آنها مدتی طول می کشد. بنابراین، در برخی موارد استفاده از عملگر زمینه در نزدیکی بسیار راحت تر است، که نشان می دهد کلمات باید در مجاورت کافی در سند قرار گیرند. استفاده از نزدیک به میزان قابل توجهی تعداد اسناد یافت شده را کاهش می دهد. وجود کاراکتر "*" در رشته پرس و جو به این معنی است که کلمه با ماسک آن جستجو می شود. برای مثال، اگر در رشته پرس و جو بنویسیم «gov*»، فهرستی از اسناد حاوی کلماتی که با «gov» شروع می‌شوند، دریافت می‌کنیم. اینها می تواند کلمات دولت، فرماندار و غیره باشد.

موتور جستجوی نه چندان محبوب Rambler آمار مربوط به ترافیک پیوندها را از پایگاه داده خود نگهداری می کند و از همان عملگرهای منطقی AND، OR، NOT، متاسامبل * (شبیه به کاراکتر * که محدوده پرس و جو را در AltaVista گسترش می دهد)، نمادهای ضریب + پشتیبانی می کند. و -، برای افزایش یا کاهش معنی کلمات وارد شده به درخواست.

بیایید به محبوب ترین فناوری ها برای جستجوی اطلاعات در اینترنت نگاه کنیم.

2.2 موتورهای جستجو

موتورهای جستجوی وب سرورهایی با پایگاه داده عظیمی از URL ها هستند که به طور خودکار به صفحات WWW در همه این آدرس ها دسترسی پیدا می کنند، محتویات این صفحات را بررسی می کنند، کلمات کلیدی را از صفحات در پایگاه داده خود تشکیل می دهند و می نویسند (صفحات را نمایه می کند).

علاوه بر این، ربات‌های موتورهای جستجو، لینک‌های موجود در صفحات را دنبال می‌کنند و دوباره آن‌ها را فهرست می‌کنند. از آنجایی که تقریباً هر صفحه WWW پیوندهای زیادی به صفحات دیگر دارد، با چنین کاری، یک موتور جستجو می تواند از نظر تئوری تمام سایت های موجود در اینترنت را به عنوان نتیجه نهایی بخزد.

این نوع ابزار جستجو در بین تمامی کاربران اینترنت معروف ترین و محبوب ترین است. همه نام موتورهای جستجوی وب معروف (موتورهای جستجو) - Yandex، Rambler، Aport را شنیده اند.

برای استفاده از این نوع ابزار جستجو، باید به سراغ آن رفته و کلمه کلیدی مورد نظر خود را در نوار جستجو تایپ کنید. در مرحله بعد، نتایجی را از پیوندهای ذخیره شده در پایگاه داده موتور جستجو دریافت خواهید کرد که به درخواست شما نزدیکتر هستند. برای تاثیرگذاری بیشتر جستجوی خود، از قبل به نکات زیر توجه کنید:

  • در مورد موضوع درخواست تصمیم گیری کنید. در نهایت دقیقاً چه چیزی را می خواهید پیدا کنید؟
  • به زبان، دستور زبان، استفاده از نمادهای غیر تحت اللفظی مختلف، مورفولوژی نیز توجه کنید. هر موتور جستجو شکل خاص خود را از ساخت پرس و جو دارد - اصل یکسان است، اما نمادها یا عملگرهای مورد استفاده ممکن است متفاوت باشند. فرم های درخواست مورد نیاز نیز بسته به پیچیدگی نرم افزار موتور جستجو و خدماتی که ارائه می دهند متفاوت است. به هر حال، هر موتور جستجو دارای یک بخش "راهنما" است، که در آن تمام قوانین نحو، و همچنین توصیه ها و نکات جستجو به وضوح توضیح داده شده است (عکس از صفحات موتور جستجو).
  • از قابلیت های موتورهای جستجوی مختلف استفاده کنید. اگر آن را در Yandex پیدا نکردید، در گوگل امتحان کنید. از خدمات جستجوی پیشرفته استفاده کنید.
  • برای حذف اسناد حاوی عبارات خاص، قبل از هر کلمه از علامت "-" استفاده کنید. به عنوان مثال، اگر به اطلاعاتی در مورد آثار شکسپیر، به استثنای "هملت" نیاز دارید، یک پرس و جو را به شکل: "Shakespeare-Hamlet" وارد کنید. و برای اطمینان از اینکه پیوندهای خاصی در نتایج جستجو گنجانده شده اند، از نماد "+" استفاده کنید. بنابراین، برای یافتن پیوندهایی در مورد فروش خودرو به طور خاص، به عبارت "فروش + خودرو" نیاز دارید. برای افزایش کارایی و دقت جستجوی خود، از ترکیب این نمادها استفاده کنید.
  • هر پیوند در لیست نتایج جستجو حاوی چندین خط از سند یافت شده است که در میان آنها کلمات کلیدی شما ظاهر می شود. قبل از کلیک بر روی پیوند، ارتباط قطعه را با موضوع درخواست ارزیابی کنید. پس از دنبال کردن پیوند به یک سایت خاص، به دقت به صفحه اصلی نگاه کنید. به عنوان یک قاعده، صفحه اول برای درک اینکه آیا به آدرس درستی آمده اید یا نه کافی است. اگر بله، جستجوهای بیشتری را برای اطلاعات لازم در سایت انتخاب شده انجام دهید (در بخش های سایت اگر نه، به نتایج جستجو برگردید و پیوند بعدی را امتحان کنید).
  • به یاد داشته باشید که موتورهای جستجو اطلاعات خود را تولید نمی کنند (به جز توضیحاتی در مورد خودشان). یک موتور جستجو فقط یک واسطه بین صاحب اطلاعات (سایت) و شما است. پایگاه‌های اطلاعاتی دائماً به‌روزرسانی می‌شوند، آدرس‌های جدیدی به آنها اضافه می‌شود، اما عقب ماندگی اطلاعاتی که واقعاً در جهان وجود دارد همچنان باقی است. صرفاً به این دلیل که موتورهای جستجو با سرعت نور کار نمی کنند.

معروف ترین موتورهای جستجوی وب عبارتند از: Google، Yahoo، Alta Vista، Excite، Hot Bot، Lycos. در میان روسی زبان ها می توان Yandex، Rambler، Aport را برجسته کرد.

موتورهای جستجو بزرگترین و با ارزش ترین هستند، اما از تنها منابع اطلاعاتی در اینترنت دور هستند، زیرا علاوه بر آنها، راه های دیگری نیز برای جستجو در اینترنت وجود دارد.

2.3 دایرکتوری ها

کاتالوگ منابع اینترنتی یک کاتالوگ سلسله مراتبی است که به طور مداوم به روز می شود و شامل بسیاری از دسته ها و سرورهای وب منفرد با شرح مختصری از محتویات آنهاست خاص یکی از مزایای دایرکتوری های موضوعی این است که توضیحات لینک ها توسط سازندگان دایرکتوری ارائه می شود و محتوای آن را به طور کامل منعکس می کند، یعنی به شما این امکان را می دهد که با دقت بیشتری تعیین کنید که محتوای سرور چقدر با محتوای سرور مطابقت دارد. هدف از جستجوی شما

نمونه ای از کاتالوگ موضوعی به زبان روسی منبع http://www.ulitka.ru/ است.

در صفحه اصلی این سایت یک روبریکاتور موضوعی وجود دارد،

با کمک آن کاربر خود را در بخشی با پیوندهایی به محصولات مورد علاقه خود می یابد.

علاوه بر این، برخی دایرکتوری های موضوعی به شما امکان جستجو بر اساس کلمات کلیدی را می دهند. کاربر کلمه کلیدی مورد نظر را در نوار جستجو وارد می کند

و لیستی از لینک ها را با توضیحات سایت هایی دریافت می کند که بیشتر با درخواست او مطابقت دارند. شایان ذکر است که این جستجو در محتویات سرورهای WWW انجام نمی شود، بلکه در توضیحات مختصر آنها که در دایرکتوری ذخیره شده است، انجام می شود.

در مثال ما، کاتالوگ همچنین دارای قابلیت مرتب سازی سایت ها بر اساس تعداد بازدید، حروف الفبا و تاریخ ورود است.

نمونه های دیگر از فهرست های روسی زبان:
[email protected]
فهرست وب
Vsego.ru
در میان کاتالوگ های انگلیسی زبان می توان به موارد زیر اشاره کرد:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 پیوند مجموعه ها

مجموعه پیوندها پیوندهایی هستند که بر اساس موضوع مرتب شده اند. آنها از نظر محتوا کاملاً با یکدیگر متفاوت هستند، بنابراین برای یافتن انتخابی که به بهترین وجه با علایق شما مطابقت دارد، باید خودتان آنها را مرور کنید تا نظر خود را ایجاد کنید.

به عنوان مثال، بیایید مجموعه ای از پیوندهای "گنجینه های اینترنتی" JSC "Relcom" را در نظر بگیریم.

کاربر روی هر یک از بخش هایی که مورد علاقه او است کلیک می کند

  • محتوا

    رانندگان

    • نجوم و طالع بینی
    • خانه شما
    • حیوانات خانگی شما
    • کودکان گلهای زندگی هستند
    • اوقات فراغت
    • شهرها در اینترنت
    • بهداشت و پزشکی
    • خبرگزاری ها و خدمات
    • موزه تاریخ محلی و غیره
    • الکترونیک خودرو.
    • موزه خودروهای عتیقه
    • دانشکده حمایت حقوقی مالکان خودرو.
    • اسپرت درایو.

    مزیت این نوع از ابزارهای جستجو، تمرکز آنها است که معمولاً این انتخاب شامل منابع اینترنتی کمیاب است که توسط یک وب مستر خاص یا صاحب یک صفحه اینترنتی انتخاب شده است.

    2.5 پایگاه داده آدرس ها

    پایگاه داده های آدرس، سرورهای جستجوی خاصی هستند که معمولاً از طبقه بندی بر اساس نوع فعالیت، محصولات و خدمات ارائه شده و جغرافیا استفاده می کنند. گاهی اوقات آنها با جستجوی حروف الفبا تکمیل می شوند. سوابق پایگاه داده اطلاعات مربوط به سایت هایی را که اطلاعات ایمیل، سازمان و آدرس پستی را در ازای پرداخت هزینه ارائه می کنند، ذخیره می کند.

    بزرگترین پایگاه داده آدرس انگلیسی زبان: http://www.lookup.com/ -

    هنگامی که در این زیر شاخه ها قرار می گیرد، کاربر پیوندهایی به سایت هایی می یابد که اطلاعات مورد علاقه او را ارائه می دهند.

    ما پایگاه‌های اطلاعاتی قابل دسترسی و رسمی از آدرس‌ها در فدراسیون روسیه را نمی‌شناسیم.

    2.6 جستجوی آرشیو Gopher

    Gopher یک سیستم به هم پیوسته از سرورها (فضای Gopher) است که از طریق اینترنت توزیع می شود.

    فضای Gopher حاوی یک کتابخانه ادبی غنی است، اما مواد برای مشاهده از راه دور در دسترس نیستند: کاربر فقط می‌تواند فهرست مطالب سازمان‌یافته سلسله مراتبی را مشاهده کند و یک فایل را با نام انتخاب کند. با استفاده از برنامه ویژه(ورونیکا) چنین جستجویی را می توان به طور خودکار با استفاده از پرس و جوهای مبتنی بر کلمات کلیدی انجام داد.

    تا سال 1995، Gopher پویاترین فناوری اینترنت بود: نرخ رشد تعداد سرورهای مربوطه از نرخ رشد سرورهای سایر انواع اینترنت پیشی گرفت. سرورهای Gopher توسعه فعال در شبکه EUnet/Relcom دریافت نکردند و امروزه تقریباً هیچ کس آنها را به خاطر نمی آورد.

    2.7 سیستم جستجوی FTP

    یاب فایل FTP نوع خاصی از ابزار جستجوی اینترنتی است که به شما امکان می دهد فایل های موجود در سرورهای FTP "ناشناس" را پیدا کنید. پروتکل FTP برای انتقال فایل ها از طریق شبکه طراحی شده است و از این نظر از نظر عملکرد نوعی آنالوگ Gopher است.

    معیار اصلی جستجو نام فایل است که به روش های مختلف (تطابق دقیق، زیر رشته، عبارت منظم و غیره) مشخص شده است. این نوع جستجو البته نمی‌تواند با موتورهای جستجو رقابت کند، زیرا در هنگام جستجو به محتوای فایل‌ها توجه نمی‌شود و همانطور که می‌دانید می‌توان به فایل‌ها نام دلخواه داد. با این حال، اگر شما نیاز به پیدا کردن یک برنامه شناخته شده یا توضیحات استاندارد دارید، به احتمال زیاد فایل حاوی آن نام مناسبی خواهد داشت و می توانید آن را با استفاده از یکی از سرورهای جستجوی FTP پیدا کنید:

    FileSearch بر اساس نام خود فایل ها و دایرکتوری ها، فایل ها را در سرورهای FTP جستجو می کند. اگر به دنبال هر برنامه یا چیز دیگری هستید، به احتمال زیاد در سرورهای WWW توضیحات آنها را خواهید یافت و از سرورهای FTP می توانید آنها را برای خودتان دانلود کنید.

    2.8 سیستم جستجو در کنفرانس های خبری Usenet

    USENET NEWS یک سیستم کنفرانس از راه دور برای جامعه اینترنتی است. در غرب معمولاً به این سرویس اخبار می گویند. مشابه نزدیک کنفرانس های تلفنی، به اصطلاح "پژواک" در شبکه FIDO است.

    از دیدگاه یک مشترک گروه خبری، USENET یک تابلوی اعلانات با بخش هایی است که در آن می توانید مقالاتی در مورد همه چیز از سیاست گرفته تا باغبانی پیدا کنید. این تابلوی اعلانات مانند ایمیل از طریق کامپیوتر قابل دسترسی است. بدون ترک رایانه، می‌توانید مقالاتی را در یک کنفرانس خاص بخوانید یا پست کنید، توصیه‌های مفیدی بیابید یا به بحث‌ها بپیوندید. به طور طبیعی، مقالات فضایی را در رایانه اشغال می کنند، بنابراین برای همیشه ذخیره نمی شوند، بلکه به طور دوره ای از بین می روند تا جایی برای مقالات جدید باز شود. در سرتاسر جهان، بهترین سرویس برای جستجوی اطلاعات در کنفرانس های Usenet، سرور Google Groups (Google Inc.) است.

    Google Groups یک انجمن آنلاین رایگان و سرویس گروه بحث است که بزرگترین آرشیو پیام‌های Usenet در اینترنت را ارائه می‌کند (بیش از یک میلیارد پیام برای کسب اطلاعات بیشتر در مورد شرایط استفاده از این سرویس، به http://groups.google.com/intl/ مراجعه کنید). ru /googlegroups/tour/index.html

    در میان روسی زبان ها، سرور سیستم جهانی USENET و کنفرانس های راه دور Relcom برجسته هستند. درست مانند سایر سرویس های جستجو، کاربر یک رشته پرس و جو را تایپ می کند و سرور لیستی از کنفرانس ها حاوی کلمات کلیدی تولید می کند. در مرحله بعد، باید در کنفرانس های منتخب در برنامه خبری مشترک شوید. همچنین یک سرور روسی مشابه FidoNet Online وجود دارد: کنفرانس‌های Fido در WWW.

    2.9 موتورهای جستجوی متا

    برای جستجوی سریع پایگاه های داده چندین موتور جستجو به طور همزمان، بهتر است به سیستم های متا جستجو مراجعه کنید.

    موتورهای جستجوی متا موتورهای جستجویی هستند که درخواست شما را به تعداد زیادی از موتورهای جستجوی مختلف ارسال می‌کنند، سپس نتایج را پردازش می‌کنند، آدرس‌های منابع تکراری را حذف می‌کنند و طیف وسیع‌تری از آنچه در اینترنت ارائه می‌شود را ارائه می‌دهند.

    محبوب ترین موتور جستجوی متا در جهان Search.com است.

    موتور جستجوی یکپارچه Search.com CNET، Inc شامل تقریباً دوجین موتور جستجو است که پیوندهای آنها مملو از پیوندها در سراسر اینترنت است.

    با استفاده از این نوع ابزارهای جستجو، کاربر می تواند اطلاعات را در انواع موتورهای جستجو جستجو کند، البته جنبه منفی این سیستم ها را می توان ناپایداری آنها نامید.

    2.10 سیستم های جستجوی افراد

    سیستم های جستجوی افراد سرورهای خاصی هستند که به شما امکان می دهند افراد را در اینترنت جستجو کنید. شخص و آدرس او را دریافت کنید ایمیلو URL. با این حال، باید توجه داشت که موتورهای جستجوگر افراد عمدتا اطلاعاتی را در مورد افراد دریافت می کنند آدرس های ایمیلاز منابع باز مانند انجمن های Usenet. در میان بیشترین سیستم های شناخته شدهجستجو برای افراد را می توان متمایز کرد:

    آدرس های ایمیل را جستجو کنید

    در ستون های جستجوی ویژه با اطلاعات تماس (نام. شهر، نام خانوادگی، شماره تلفن)، می توانید اطلاعات مورد نظر خود را بیابید.

    سیستم های جستجوی افراد واقعاً سرورهای بزرگی هستند.

    3. نتیجه گیری

    ما فن‌آوری‌های اصلی جستجوی اطلاعات در اینترنت را بررسی کردیم و ابزارهای جستجوی موجود در اینترنت را به‌طور کلی ارائه کردیم، همچنین ساختار جست‌وجو برای محبوب‌ترین موتورهای جستجوی روسی و انگلیسی زبان و خلاصه در بالا، مایلیم توجه داشته باشیم که هیچ طرح بهینه واحدی وجود ندارد، جستجوی اطلاعات در اینترنت وجود ندارد. بسته به مشخصات اطلاعاتی که نیاز دارید، می توانید از ابزارها و خدمات جستجوی مناسب استفاده کنید. و کیفیت نتایج جستجو به نحوه انتخاب خدمات جستجو بستگی دارد.

  • ارسال کار خوب خود به پایگاه دانش آسان است. از فرم زیر استفاده کنید

    دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

    ارسال شده در http://www.allbest.ru/

    روشهای نوین بازیابی اطلاعات

    مقدمه

    درست مانند توانایی خواندن، نوشتن یا صحبت کردن به طور عمومی، امروزه در جامعه اطلاعاتی، توانایی انجام جستجوی حرفه ای به طور شایسته، مهارت ضروری یک متخصص فکری است.

    رشد سریع و توسعه پویای منابع اطلاعاتی (عمدتاً منابع ارائه شده در اینترنت) همه را ملزم به داشتن انواع مهارت های جستجوی پیچیده می کند. توانایی جستجوی سریع و صحیح در اینترنت به معنای صرفه جویی در زمان، داشتن اطلاعات معتبر و به روز است که به معنای نتیجه گیری درست و تصمیم گیری درست است.

    اکتشافی اطلاعات برای کمک به یک متخصص در هنگام حل مشکلات فکری خاص به سرعت یک جستجوی انتخابی و موثر طراحی شده است.

    مشکل جستجو و استفاده از اطلاعات یکی از مبرم ترین مسائل در علم مدرن است. البته اینترنت برای جستجوی کارآمد و باکیفیت اطلاعات ضروری است. با این حال، این واقعیت که لایه عظیمی از دانش بشری در اینترنت ذخیره شده است، مدرکی نیست راندمان بالاجستجو و استفاده از اطلاعات حتی اگر اطلاعات به شکلی مناسب ارائه شود، فرد در نهایت باید به آن تسلط پیدا کند. و اثربخشی و کیفیت کار او به تسلط او بر روش ها و تکنیک های جستجو بستگی دارد.

    در نتیجه، اساس استفاده از اطلاعات، مشکل جستجو و تبدیل آن به محتوا و شکلی است که امکان جذب راحت و کارآمدتر اطلاعات و استفاده مؤثر از آن در فعالیت های اجتماعی را ایجاد می کند.

    در این راستا، هدف این کار بررسی ویژگی‌های توسعه و انتشار اطلاعات، در نظر گرفتن اهداف و روش‌های اصلی بازیابی اطلاعات، تجزیه و تحلیل قواعد ساخت استراتژی جستجو و تدوین یک پرسش جستجو است.

    بخش اصلی

    اکتشافی در معنای عام هنر و علم کشف و جستجوی خلاقانه در یک حوزه موضوعی پیچیده است.

    در عین حال، اکتشافی معانی زیادی دارد.

    بنابراین، اکتشافی یک سیستم آموزشی است که باعث ارتقای توانمندی در دانش آموزان، توانایی کسب مستقل دانش، فعالیت شناختی و نیاز به دانش می شود.

    همچنین علم اکتشافی علم الگوها و روشهای کشف و مطالعه چیزهای جدید در فعالیت خلاق و شناختی انسان است. روانشناسی خلاقیت

    اکتشافی به یک روش حل مسئله اشاره دارد که از آزمون و خطا و نتایج تجربی برای یافتن مسیر مستقیم به یک راه حل استفاده می کند.

    اکتشافی روش‌های خاصی برای حل مسائل (روش‌های اکتشافی) است که معمولاً در مقابل روش‌های حل رسمی مبتنی بر دقیق هستند. مدل های ریاضی. استفاده از روش های اکتشافی (اکتشافی) زمان حل یک مسئله را در مقایسه با روش شمارش کامل غیر جهت دار جایگزین های ممکن کاهش می دهد. راه حل های به دست آمده، به عنوان یک قاعده، بهترین نیستند، بلکه فقط به مجموعه ای از راه حل های امکان پذیر مربوط می شوند.

    اکتشافی مجموعه ای از مکانیسم های ذاتی برای یک فرد است که با کمک آنها رویه هایی با هدف حل مشکلات خلاقانه ایجاد می شود (به عنوان مثال مکانیسم هایی برای ایجاد روابط موقعیتی در یک موقعیت مشکل ، قطع شاخه های غیر منتظره در درخت گزینه ها ، ایجاد رد با استفاده از نمونه های متقابل و غیره). این مکانیسم ها که مجموعاً فرانظریه حل مسائل خلاق را تعریف می کنند، ماهیت جهانی دارند و به مشکل خاصی که حل می شود بستگی ندارند.

    اکتشافی علمی است که به مطالعه فعالیت های اکتشافی می پردازد. شاخه خاصی از علم تفکر. هدف اصلی آن فعالیت خلاق است. مهم‌ترین مشکلات، وظایف مرتبط با مدل‌های تصمیم‌گیری (در شرایط موقعیت‌های مشکل غیراستاندارد)، جستجوی چیزی جدید برای یک موضوع یا جامعه، ساختار توصیفی از دنیای بیرون (بر اساس طبقه‌بندی‌هایی مانند سیستم تناوبی یا طبقه بندی K. Linnaeus). اکتشافی به عنوان یک علم در تقاطع روانشناسی، نظریه هوش مصنوعی، زبان شناسی ساختاری و نظریه اطلاعات توسعه می یابد.

    بنابراین، کلمه مرکزی اکتشافی جستجو (اطلاعات) است.

    شکی نیست که توسعه روش‌هایی برای کسب و استفاده از اطلاعات مختلف اجتماعی به طور سنتی مشکل اصلی سازمان‌دهی علمی کار تخصصی بوده است.

    برای تصمیم گیری در هر موقعیت خاص، یک متخصص باید کامل ترین و به روزترین اطلاعات مربوط به یک مورد خاص را به دست آورد.

    انتخاب منابع اطلاعات، استراتژی های جستجوی آن، روش های بررسی قابلیت اطمینان و انطباق با اطلاعات موجود، روش های ارزیابی سودمندی اطلاعات یافت شده برای حل مشکلات - همه این عوامل از ویژگی های رفتار اطلاعاتی انسان هستند.

    معیار فرهنگ اطلاعاتی یک فرد را می توان توانایی او در فرمول بندی مناسب نیاز خود به اطلاعات در کل مجموعه منابع اطلاعاتی، پردازش اطلاعات و ایجاد اطلاعات کیفی جدید، حفظ سیستم های بازیابی اطلاعات فردی و انتخاب و ارزیابی مناسب اطلاعات در نظر گرفت.

    اینترنت دسترسی به بسیاری از منابع اطلاعاتی را که در حال حاضر برای خوانندگان کتابخانه های روسیه غیرممکن است، از طریق دیگری به دست آورده است. گرد هم آوردن محلی، ملی و شبکه های جهانی، به یک منبع اطلاعاتی عظیم تبدیل شده است که پویاترین منبع اطلاعاتی موجود در حال حاضر است.

    یکی از ویژگی های بسیار مهم اینترنت این است که کاربر نه تنها به اطلاعات دسترسی پیدا می کند، بلکه خودش آن را تولید می کند. علاوه بر این، جستجوی اطلاعات در شرایط جدید و در یک محیط اطلاعاتی جدید به خود متخصص واگذار می شود.

    در این زمینه دو نکته مثبت قابل ذکر است:

    -احتمال شناسایی اطلاعاتی را که در اصل مفید هستند، اما به طور رسمی با درخواست مطابقت ندارند، افزایش می دهد. برخلاف یک واسطه، یک متخصص مجبور نیست که به شدت به عبارت درخواست پایبند باشد. او خود با موتور جستجو گفتگو می کند و بسته به نتایج دریافت شده تاکتیک های جستجو را تغییر می دهد.

    - پایه های تفکر علمی و مهارت های کار پژوهشی شکل می گیرد. متخصص یاد می گیرد که در فضای شبکه پیمایش کند، از بین تعداد زیادی اسناد آنچه واقعاً ضروری است را انتخاب کند و در نهایت، درخواست خود را بسته به تجزیه و تحلیل اسناد از قبل شناسایی شده تغییر دهد.

    با این حال، کاربران اغلب از نتایج جستجو در یک محیط اطلاعاتی جدید احساس رضایت نمی کنند. این معمولاً به دلایل زیر رخ می دهد:

    به عنوان یک قاعده، کاربران از موتورهای جستجو (AltaVista، HotBot) یا فهرست منابع (Yahoo) به عنوان ابزار جستجو استفاده می کنند. موتورهای جستجوی ذکر شده علیرغم یکسری مزایا، کنترل کیفی علمی را ارائه نمی کنند (یعنی فرآیند گنجاندن اطلاعات در پایگاه داده این موتورهای جستجو تحت کنترل کارشناسان موضوعی نیست) که می تواند منجر به غیر قابل اعتماد بودن شود. اطلاعاتی که در نتیجه جستجو به دست می آید؛

    -عدم دانش و مهارت در نوشتن یک پرس و جو به موتور جستجو منجر به دریافت حجم زیادی از نویز اطلاعاتی می شود.

    - کاربر اغلب از این واقعیت غافل است که با وجود این واقعیت که اطلاعات در اینترنت وجود دارد، خارج از میدان دید موتورهای جستجو است. فقدان دانش اولیه از انجام جستجو منجر به کاهش کامل بودن اطلاعات دریافتی می شود.

    بنابراین، می توان استدلال کرد که فرصت های موجود در اینترنت بیشتر از آنچه در حال حاضر استفاده می شود وجود دارد. و بنابراین، مشکل کمبود اطلاعات با کیفیت در اینترنت نیست، بلکه ناتوانی یک متخصص در یافتن آن است.

    در چارچوب علم کتابشناسی، تعداد زیادی از تجربه تاریخیجستجو و استفاده از منابع اطلاعاتی در علم کتابشناسی است که یک رشته علمی خاص - اکتشافی کتابشناختی - شکل گرفته و اکنون به طور هدفمند در حال توسعه است.

    اکتشافی کتابشناختی یکی از مهم ترین و فعال ترین بخش های علم عمومی کتابشناسی و علم کتابشناسی است. در شرایط مدرن شتاب و پیچیدگی فرآیندهای اطلاعاتی در جامعه، توجه ویژه ای به آن می شود.

    اکتشافی کتابشناختی به عنوان یک رشته کتابشناختی درک می شود که تاریخ، نظریه و روش شناسی بازیابی اطلاعات را توسعه می دهد.

    مقوله «اطلاعات» مفهوم «اطلاعات کتابشناختی» را نیز در بر می گیرد که یکی از مهم ترین مؤلفه های آن است. این با نقش کارکردی، یعنی وظیفه اجتماعی که جامعه از طریق اطلاعات کتابشناختی در فرآیند تولید، انتشار و استفاده از اطلاعات و دانش اجتماعی حل می کند، توضیح داده می شود.

    ماهیت عینی وجود و استفاده از چنین اطلاعاتی، انواع وظایف را در جستجوی آن از پیش تعیین می کند. به طور کلی، تنوع واقعی چنین وظایفی را می توان به سه هدف اصلی بازیابی اطلاعات کاهش داد:

    -جستجوی اطلاعات لازم در مورد منبع و احراز حضور آن در سامانه سایر منابع. با جستجوی اطلاعات کتابشناختی و کمک های کتابشناختی (نشریات اطلاعاتی) که به ویژه برای جستجو و استفاده کارآمدتر از اطلاعات (ادبیات، کتاب) ایجاد شده است.

    - جستجوی خود منابع اطلاعاتی (اسناد و نشریات) که حاوی یا ممکن است حاوی اطلاعات لازم باشد.

    -جستجوی اطلاعات واقعی موجود در ادبیات، کتابها، به عنوان مثال، درباره حقایق و رویدادهای تاریخی، در مورد مشخصات فنیماشین‌ها و فرآیندها، در مورد خواص مواد و مواد، در مورد داده‌های بیوگرافی از زندگی و کار یک نویسنده، دانشمند و غیره.

    این اهداف همچنین سه نوع اصلی بازیابی اطلاعات را تعیین می کنند: کتابشناختی، اسنادی و فاکتوگرافیک که ارتباط نزدیکی با یکدیگر دارند.

    به عنوان مثال، برای یافتن یک منبع اطلاعاتی (سند یا نشریه)، باید مجموعه خاصی از اطلاعات کتابشناختی (حقایق) را بدانید که آن را مشخص می کند و آن را از بسیاری دیگر متمایز می کند: حداقل از مواردی که توسط همان نویسنده نوشته شده است. همان موضوع، منتشر شده توسط همان انتشارات، در همان سال و غیره. بنابراین، ابتدا باید یک جستجوی کتابشناختی انجام دهید. و برعکس، برای انجام یک جستجوی واقعی در هر زمینه دانش یا عمل، ابتدا باید آن منابع ادبی (اسناد، نشریات) را که ممکن است حاوی حقایق مورد علاقه ما باشد، پیدا کنیم. بنابراین، ابتدا باید یک جستجوی کتابشناختی و مستند انجام دهید.

    جستجو و استفاده از جریان های قدرتمند اطلاعات به طور فزاینده ای دشوار می شود.

    و برای این، اکتشافی کتابشناختی تعدادی روش برای جستجوی اطلاعات دارد: پیوسته، انتخابی، شهودی، گونه شناسی ("دستور العمل")، استقرایی، قیاسی، روش مراجع کتابشناختی، روش صعود از انتزاعی به عینی.

    بیایید به طور خلاصه به آنها نگاه کنیم.

    بنابراین، یک روش محکم. این نظرسنجی کامل و بدون حذفیات، تمامی منابع و کمک های موجود در دسترس است. بدیهی است که در شرایط مدرن اجرای این تکنیک حتی برای یک موضوع محدود دشوار است. بنابراین، اغلب صرفاً صرفاً نظری در نظر گرفته می شود.

    روش نمونه‌گیری روشی منطقی‌تر و واقعی‌تر برای جستجوی اطلاعات است که به انتخاب و مطالعه مجموعه معینی از منابع ختم می‌شود.

    روش شهودی به توانایی یافتن مطالب لازم از طریق حس کتابشناختی و تجربه طولانی مدت اشاره دارد.

    روش نوع‌شناسی یا دستوری، زمانی که استفاده از وظایف بازیابی اطلاعات به هر بازیابی اطلاعات خاص اجازه می‌دهد تا یک مسیر مشخص و ابزارهای مستند (راهنماها، منابع) یک راه حل را ترسیم کند، یعنی نوعی مدل، دستور العملی برای حل ارائه دهد. این کار جستجو بنابراین، مدل استاندارد بهینه برای توسعه "دستور العمل های" مختلف برای بازیابی اطلاعات یک توصیف کتابشناختی است.

    روش استقرایی بازیابی اطلاعات. فرآیند شناخت با استفاده از استقرا از قضاوت ها و حقایق فردی تا قوانین کلیو تعمیم هایی که یک الگوی کلی را بیان می کنند.

    روش قیاسی بازیابی اطلاعات. اگر با استفاده از روش قیاسی جستجو کنیم، تصویر مخالف ایجاد می شود. چنین جهت گیری فکری می تواند هنگام مطالعه یک منطقه خاص از پدیده ها، ایجاد یک نظریه علمی دقیق و غیره رخ دهد.

    روش بازیابی اطلاعات با استفاده از منابع کتابشناختی. امکان استفاده از آن در ماهیت ادبیات نهفته است که از رابطه معینی از حقایق، آثار، اسناد و انتشارات تشکیل شده است. هر اثر ادبی جدید، تا حدی، تحلیل، ارزیابی و تعمیم اطلاعات اجتماعی است که از قبل در ادبیات موجود است. شکل خاصی از بازتاب این رابطه و تداوم توسعه ادبی، مرجع کتابشناختی (پاورقی) است.

    روش های ارائه شده به شما امکان می دهد اطلاعات لازم را در محیط اطلاعات سنتی پیدا کنید.

    با این حال، در زمان ما، نه کمتر، و در برخی موارد بسیار مهمتر، روش ها و تکنیک های جستجوی اطلاعات در محیط جدید اطلاعاتی - اینترنت - هستند.

    جستجوی اطلاعات را می توان با استفاده از روش های مختلفی انجام داد که هم از نظر کارایی و کیفیت جستجو و هم از نظر نوع اطلاعات بازیابی شده تفاوت قابل توجهی دارند.

    بیایید روش های اصلی جستجوی اطلاعات در اینترنت را در نظر بگیریم که به صورت جداگانه یا ترکیبی با یکدیگر استفاده می شوند.

    اول از همه، این استفاده از موتورهای جستجو است. در حال حاضر، این روش یکی از اصلی ترین و در واقع تنها روش هنگام انجام جستجوی اولیه است. در نتیجه جستجو، فهرستی از منابع اینترنتی ظاهر می شود که باید آنها را به تفصیل در نظر بگیرید.

    استفاده از موتورهای جستجو بر اساس استفاده از کلمات کلیدی ارسال شده به سرورهای جستجو به عنوان آرگومان های جستجو است.

    جستجوی مستقیم با استفاده از لینک های فرامتن نیز به عنوان روش در نظر گرفته می شود. از آنجایی که همه سایت‌ها در شبکه جهانی وب در واقع به هم مرتبط هستند، اطلاعات را می‌توان با مشاهده متوالی صفحات مرتبط با استفاده از یک مرورگر جستجو کرد.

    در نگاه اول، این روش جستجوی کاملا دستی مانند یک نابهنگام کامل به نظر می رسد، در عین حال، این روش صفحات وب اغلب تنها روش ممکن در مراحل نهایی جستجوی اطلاعات است، زمانی که تحقیقات مکانیکی جای خود را به جستجوی بیشتر می دهد. تجزیه و تحلیل عمیق

    در عین حال استفاده از کاتالوگ ها، فهرست های طبقه بندی شده و موضوعی و انواع دایرکتوری ها نیز در این نوع جستجو صدق می کند.

    جستجو با استفاده از ابزارهای ویژه یک روش کاملاً خودکار است که برای انجام جستجوی اولیه بسیار مؤثر است.

    ماهیت این روش در استفاده از برنامه های تخصصی - عنکبوت ها نهفته است که به طور خودکار صفحات وب را اسکن می کنند و به دنبال اطلاعات مورد نیاز در آنها می گردند.

    یعنی می توانیم در مورد یک گزینه مرور خودکار با استفاده از پیوندهای فرامتن صحبت کنیم (موتورهای جستجو از روش های مشابه استفاده می کنند).

    این روش به ویژه در صورتی موثر است که استفاده از موتورهای جستجو به دلیل غیراستاندارد بودن درخواست یا دلایل دیگر نتایج لازم را ارائه ندهد.

    روش دیگر تجزیه و تحلیل منابع جدید است که جستجو برای آنها ممکن است هنگام انجام چرخه های جستجوی مکرر، جستجوی آخرین اطلاعات یا برای تجزیه و تحلیل روند توسعه موضوع مطالعه در طول زمان ضروری باشد.

    دلیل دیگر این جستجو این است که بیشتر موتورهای جستجو با تأخیر قابل توجهی که ناشی از حجم عظیمی از داده‌های در حال پردازش است، فهرست‌های خود را به‌روزرسانی می‌کنند و این حذف معمولاً هر چه موضوع مورد علاقه کمتر مورد توجه قرار گیرد بیشتر است. این توجه هنگام انجام جستجو در یک زمینه موضوعی بسیار تخصصی بسیار مهم است.

    بدیهی است که جستجوی اطلاعات در اینترنت بیشتر به عنوان فرآیندی برای حل مشکل جستجوی پیش روی کاربر تلقی می شود و نه صرفاً یافتن اطلاعات مرتبط با درخواست.

    مراحل اصلی روش جستجو عبارتند از:

    -تدوین و شفاف سازی درخواست اطلاعات. در این مرحله، یک محدودیت هدفمند و مشخص کردن هدف کلی جستجو وجود دارد.

    -برنامه ریزی روش جستجو هدف اصلی این فرآیند- تعیین راه ها و ابزارهای حل منطقی مسئله جستجو. این مرحله شامل توسعه استراتژی‌های جستجو می‌شود که به مجموعه‌های شناسایی شده نیازها می‌پردازد.

    -اجرای جستجو راه حل نهایی برای مشکل جستجو

    تکنیک جستجوی اطلاعات شامل چندین مرحله است.

    مرحله اول تدوین و شفاف سازی درخواست اطلاعات است. این مرحله به طور سنتی نقش اصلی را ایفا می کند. انتخاب بعدی منابع اطلاعاتی به نحوه صحیح فرموله شدن درخواست بستگی دارد. «درخواست شفاف‌سازی» در عمل کتابخانه‌ای مجموعه‌ای از معیارها یا سؤالات ضروری برای روشن شدن نیاز کاربر به اطلاعات است. در طول مصاحبه، نوع منبعی که جستجو در آن انجام خواهد شد، محتوای موضوع و عمق جستجوی گذشته‌نگر روشن می‌شود. در این مرحله توصیه می شود:

    -تدوین یک درخواست به زبان طبیعی؛

    - تعیین نوع نیاز اطلاعاتی؛

    - تعیین هدف جستجوی اطلاعات؛

    - تعیین محدودیت های جستجوی لازم؛

    - فرمول نهایی درخواست اطلاعات.

    هدف مرحله 1 ایجاد ایده ای از اطلاعاتی است که به دنبال آن هستید. برای به دست آوردن این ایده، صاحب اطلاعات نیاز به بیان دقیق آن به زبان طبیعی دارد.

    حتی یک ایده نسبتاً تقریبی از نوع نیاز به اطلاعات به ما امکان می دهد الزامات تعیین شده توسط آن را روشن کنیم که باید هنگام جستجو در نظر گرفته شود. به طور سنتی، دو نوع نیاز اطلاعاتی متمایز می شود: 1) زمانی که بهترین فرااطلاعات (اطلاعات در مورد اطلاعات) به عنوان اطلاعاتی شناخته می شود که به طور کامل و دقیق نیاز اطلاعاتی خاص یک مصرف کننده معین را توصیف می کند و به فرد امکان می دهد پاسخ دقیقی به دست آورد. ; 2) زمانی که مرزها به وضوح تعریف نشده اند، و همچنین ممکن است در طول زمان تغییر کنند.

    فرآیندهای بازیابی اطلاعات که به کمک آنها نیازهای اطلاعاتی انواع مختلف برآورده می شود، به طور کلی با یکدیگر متفاوت هستند و بنابراین می توان در مورد آن صحبت کرد. انواع مختلفجستجوی اطلاعات جستجوی اطلاعاتی که نیازهای اطلاعاتی نوع اول را برآورده می کند، واقعی نامیده می شود. در مورد بازیابی اطلاعاتی که نیازهای نوع دوم را برآورده می کند - به صورت مستند. با این حال، اغلب، برای یافتن برخی حقایق در اینترنت، ابتدا باید اسناد (صفحات وب) حاوی این حقایق را جستجو کنید. در این صورت می توان از جستجوی واقعی مستند صحبت کرد.

    گام بعدی تعیین هدف از جستجوی اطلاعات است که به ما امکان می دهد درجه کامل بودن اطلاعات مورد نیاز را شناسایی کنیم که بر انتخاب موتورهای جستجو نیز تأثیر می گذارد. اهداف بازیابی اطلاعات به طور سنتی مخالف یکدیگر هستند:

    -آشنایی اولیه با مشکل؛

    - مطالعه کامل مشکل

    به عنوان یک قاعده، هدف معمول جستجوی اطلاعات در جایی بین این دو افراط قرار دارد، یعنی کاربر به برخی اطلاعات نیاز دارد، اما نیازی به کامل بودن اطلاعات ندارد.

    محدودیت های اصلی به طور سنتی عبارتند از: محدودیت در انواع نشریات، زبان انتشارات، محدوده جستجوی جغرافیایی و زمانی. بنابراین، لازم است به وضوح توضیح داده شود:

    - اطلاعاتی که کاربر از چه منابعی علاقه مند است (مقالات، تک نگاری ها، مطالب کنفرانس و غیره)؛

    -به چه زبانی

    - محدوده جغرافیایی جستجو چیست.

    - دامنه زمانی جستجو چقدر است.

    برای نهایی کردن درخواست اطلاعات، لازم است تحلیل واژگانی جامعی از اطلاعات مورد جستجو انجام شود. لازم است از منبعی پیشینه ای برای توصیف دقیق و شایسته موضوع مورد مطالعه بدست آوریم. چنین منبعی می تواند یک کتاب مرجع بسیار تخصصی یا یک دایره المعارف عمومی باشد. بر اساس مطالب مورد مطالعه، لازم است تا در صورت لزوم به چندین زبان، گسترده ترین مجموعه ممکن از کلمات کلیدی را در قالب اصطلاحات، عبارات، واژگان حرفه ای و کلیشه های فردی فرموله کنید.

    هدف اصلی مرحله برنامه ریزی فرآیند جستجو، تعیین راه ها و ابزارهای حل منطقی مشکل جستجو است. توسعه را شامل می شود برنامه عمومیجستجو کنید. در همان زمان، انتخاب و ارزیابی کیفیت موتورهای جستجو انجام می شود و جستجو برای اطلاعات گم شده انجام می شود.

    در این مرحله ما در مورد مراحل زیر صحبت می کنیم:

    -انتخاب و ارزیابی کیفیت موتورهای جستجو؛

    -توسعه یک برنامه جستجوی عمومی

    انتخاب و ارزیابی کیفیت موتورهای جستجو باید از نقطه نظر انطباق آنها با نیازهای اطلاعاتی واقعی و مشخصات درخواست انجام شود. هر کاربر الزامات خاصی دارد که بر انتخاب موتور جستجو، محتوا و قابلیت های آن تأثیر می گذارد. هنگام انتخاب یک موتور جستجو، باید به پارامترهای زیر توجه کنید: حجم فهرست موتور جستجو، کنترل کیفیت اطلاعات موجود در آن، و قابلیت های زبان های پرس و جو.

    توسعه یک برنامه جستجوی عمومی شامل شناسایی اشیاء، روش ها و جهت های جستجوی احتمالی (مسیرها) بر اساس محدودیت های جستجوی شناسایی شده (موضوعی، زمانی، زبانی، جغرافیایی) و همچنین درجه کامل بودن جستجو است.

    تاکتیک‌ها و ابزارهای جستجو می‌توانند نه تنها بسته به موضوع، بلکه به سایر پارامترهای درخواست نیز به طور قابل توجهی متفاوت باشند. در اینجا باید با تعدادی دستورالعمل کلی راهنمایی شوید.

    به عنوان مثال، ماهیت جستجو به طور کامل توسط محتوای کار جستجوی ارائه شده توسط کاربر تعیین می شود. و از این نظر، مهم است که متمایز شویم که در ابتدا جستجو، همانطور که گفته شد، با موضوع و هدف توسعه دقیق و جامع طرح آن مرتبط است، زمانی که پوشش گسترده ای از منابع اطلاعاتی به ویژه ضروری است.

    در نتیجه، ابتدا جستجوی بیشتری برای منابع اطلاعاتی (یعنی مجموعه‌ای از اسناد) وجود دارد. و تنها پس از آن جستجوی اطلاعات مشخص شده و محدود به محتوای فوری مشکل جستجو در حال حل است. در این مرحله جستجوی خود اسناد غالب است.

    البته، در طول فرآیند جستجو باید ترکیب کنید انواع مختلفو روش های جستجو در دو جهت اصلی: از یک سو، از طبقه بندی کلی موتورهای جستجو به فهرست منابع موضوع محور، سپس به اسناد خاص و حقایق موجود در آنها. از سوی دیگر، از کلمات و عبارات پرس و جو منحصر به فرد گرفته تا مکان یاب منابع موضوعی خاص و/یا اسناد خاص.

    هدف آخرین مرحله حل نهایی مشکل جستجو است. همچنین شامل ایجاد ابزارهای مورد نیاز برای حل آن است.

    در این مرحله باید مراحل زیر را انجام دهید:

    -انتخاب مجموعه ای از منابع اطلاعاتی در مورد موضوع جستجو؛

    - انجام جستجو در منابع اطلاعاتی؛

    - ارزیابی کامل بودن اطلاعات؛

    - گسترش دامنه منابع اطلاعاتی

    در مرحله انتخاب مجموعه ای از منابع اطلاعاتی در مورد موضوع جستجو، جستجو در مجموعه ای از موتورهای جستجو انتخاب شده در مرحله برنامه ریزی انجام می شود. جستجو را می توان هم از خاص به عمومی و هم از عمومی به خاص انجام داد. در نتیجه فهرستی از منابع اطلاعاتی تشکیل می شود که ممکن است حاوی اطلاعاتی در مورد موضوع باشد.

    فهرست منابع اطلاعاتی به گونه ای برنامه ریزی شده است که منابع، مکمل یکدیگر، حداکثر اطلاعات مربوط به یک موضوع معین را مطابق با محدودیت های جستجوی از پیش تعیین شده پوشش دهند. اگر دامنه آنها خیلی باریک باشد، نتایج جستجو ممکن است رضایت بخش نباشد، و اگر بیش از حد وسیع باشد، تلاش جستجو افزایش می یابد.

    در این مرحله، لازم است به وضوح مشخص شود که چه چیزی در مورد اطلاعات مورد جستجو شناخته شده است و چه چیزی ناشناخته است اما نیاز به کشف دارد. به عنوان مثال، ممکن است نام مرکز اطلاعات مورد علاقه مشخص باشد، اما URL آن ناشناخته باشد. بنابراین، لازم است فهرستی از پرس و جوها برای یافتن اطلاعات گمشده ایجاد شود. این لیست بر اساس کلمات کلیدی شناسایی شده و اطلاعات منابع موجود ایجاد می شود.

    توصیه می شود با استفاده از موتورهای جستجو و متاجستجو، لینک های گم شده را در توضیحات منبع (فرا داده) جستجو کنید. با این حال، اگر چیزی در مورد منابعی که به دنبال آن هستید مشخص نیست، توصیه می شود به موتورهای جستجوی طبقه بندی یا سیستم های جستجوی فرهنگ لغت تخصصی مراجعه کنید. اگر کاربر در این زمینه متخصص نیست، باید با موتورهای جستجوی طبقه بندی با کنترل کیفیت علمی (دروازه های اطلاعاتی) تماس بگیرد.

    هنگام انجام جستجو، استفاده از روش های زیر توصیه می شود: روش حدس، روش جستجو از عمومی به خاص، روش جستجو از خاص به عمومی. روش حدس زدن به این صورت است که می توانید سعی کنید نام سازمان مورد نظر یا مخفف آن را بنویسید. روش جستجوی عمومی به خاص معمولاً هنگام انجام جستجو در موتورهای جستجوی طبقه بندی استفاده می شود. از آنجایی که جستجو در آنها فقط با دسته بندی موضوع و شرح منابع انجام می شود، توصیه می شود در ابتدا درخواست را تا حد امکان گسترش دهید. روش جستجوی خاص به عمومی معمولاً هنگام انجام جستجو در موتورهای جستجوی فرهنگ لغت استفاده می شود.

    در نتیجه فهرستی از منابع اطلاعاتی تشکیل می شود. این مرحله به شما امکان می دهد یک سیستم اطلاعات شخصی با هدف حل یک مشکل جستجوی خاص ایجاد کنید.

    هنگام انجام جستجوی سند، باید بتوانید پرس و جو خود را هم محدود و هم گسترش دهید. به عنوان یک قاعده، جستجوی اطلاعاتی که کاربر واقعاً به آن نیاز دارد، یک فعالیت متشکل از چندین مرحله است که در طی آن کاربر برخی از پرس و جوها را فرموله می کند، نمونه به دست آمده (نتیجه پرس و جو) را تجزیه و تحلیل می کند و بر اساس تجزیه و تحلیل، شفاف سازی می کند. درک او از ساختار پایگاه داده و قابلیت های موتور جستجو سیستم اطلاعاتی، اطلاعات آنها نیاز دارد و درخواست جدیدی را فرموله می کند (کهنه را روشن می کند). و دوباره مراحل نمونه برداری و تجزیه و تحلیل را جایگزین می کند و به تدریج درخواست را اصلاح می کند و به سمت هدف حرکت می کند.

    به طور سنتی، دو استراتژی اصلی جستجو وجود دارد: جستجوی صنعت و جستجوی موضوع. آنها منعکس کننده دو روند متضاد در رابطه بین علوم و شاخه های دانش هستند: تمایز علوم و ادغام آنها. استراتژی جستجوی صنعت با مشاهده طبقه‌بندی‌کننده‌های سلسله مراتبی از عمومی به خاص و با نمونه‌برداری از داده‌ها با توجه به مقادیر توصیف‌گرها و کلیدواژه‌ها (یعنی داده‌ها از در نظر گرفته می‌شوند) استراتژی جستجوی موضوعی از خاص به عمومی انجام می‌شود. دیدگاه خصوصیات "موضوع" آنها).

    انتخاب یک استراتژی جستجوی خاص به وظیفه جستجوی خاص بستگی دارد. به عنوان مثال، در صورت مساوی بودن همه چیزهای دیگر، جستجو با استفاده از کلمات کلیدی به جستجو با استفاده از طبقه بندی کننده ترجیح داده می شود، هر چه درخواست خاص تر باشد. همانطور که هنگام جستجوی منابع اطلاعاتی، هنگام جستجوی اسناد، لازم است که قابلیت های زبان های پرس و جو ارائه شده توسط DBMS های مختلف را در نظر بگیرید.

    پس از شناسایی برخی از اسناد با انجام جستجو در دایره اولیه منابع اطلاعاتی، توصیه می شود کامل بودن اطلاعات دریافتی را بررسی و ارزیابی کنید.

    کاربر همیشه به تمام اطلاعات در مورد موضوع ذکر شده نیاز ندارد. اغلب تنها چیزی که او نیاز دارد چند منبع معتبر است.

    در این مرحله لیستی از مدارک ایجاد شده و بررسی کپی برداری انجام می شود. با این حال، اگر کامل بودن اطلاعات دریافتی کافی نباشد، جستجوی اضافی برای منابع اطلاعاتی باید انجام شود.

    هنگام انجام جستجوی اطلاعات در اینترنت، که در آن کامل بودن نقش مهمی ایفا می کند، لازم است به یاد داشته باشید که هیچ موتور جستجویی هر چیزی را که در اینترنت وجود دارد ایندکس نمی کند.

    می توانید فهرست منابع اطلاعاتی را به روش های زیر گسترش دهید:

    - انجام جستجو در سیستم های فراجستجوی خارجی به منظور شناسایی پایگاه های داده اختصاص یافته به موضوع جستجو؛

    -جستجو از طریق پیوندهای فرامتن، حرکت از اسناد از قبل یافت شده.

    -جستجوی پایگاه های داده بر اساس ساختار URL اسنادی که قبلاً پیدا شده اند.

    استفاده از روش های تحقیق شده به کاربر این امکان را می دهد که به طور مستقل اطلاعات را در یک محیط اطلاعاتی جدید جستجو کند. این امکان را نه تنها بهبود کیفیت اطلاعات به دست آمده در نتیجه جستجو، بلکه افزایش کامل بودن آن را نیز ممکن می سازد.

    و در پایان، من همچنین می خواهم به نکاتی از شرکت کنندگان جام روسیه در مورد جستجو در اینترنت توجه کنم:

    1. سعی کنید معنی سوال را بفهمید. شاید شما از قبل پاسخ را بدانید. برای یافتن آدرس صحیح صفحه، هم به دنبال کلمات کلیدی در سوال و هم به دنبال پاسخی که می دانید بگردید.

    2. تعداد اسناد به دست آمده در نتیجه جستجو می تواند بسیار زیاد باشد. بنابراین، مجموعه صحیح کلمات کلیدی برای جستجوی بهینه اطلاعات بسیار مهم است.

    3. املای کلمات را بررسی کنید. اگر لیست صفحات یافت شده خیلی کوچک است از مترادف استفاده کنید.

    4. جستجو برای بیش از یک کلمه در یک زمان. جستجوی خود را تا حد امکان محدود کنید.

    5. از تنظیمات جستجو در موتورهای جستجو برای تنظیم پارامترهای مناسب برای توضیحات اسناد و ساختار صفحه با نتایج جستجو استفاده کنید.

    نتیجه گیری

    این مطالعه موضوعاتی از نظریه، روش ها و روش شناسی کتابشناختی و اکتشافی اطلاعاتی را ارائه و مورد بحث قرار داد.

    بدیهی است که تسلط بر مبانی این رشته برای شکل گیری عناوین و مهارت های حرفه ای هر متخصصی ضروری است.

    از آنجایی که آموزش یک متخصص مدرن نه چندان باید مهارت ها و توانایی های حرفه ای او را تضمین کند، بلکه باید توانایی سازگاری اجتماعی و رقابت پذیری فرد را تضمین کند، سواد اطلاعاتی یک متخصص اساس صلاحیت حرفه ای او و عاملی در آن است. توسعه

    در روند اجرای جستجوی اطلاعات، شما باید با تعدادی از توصیه های روش شناختی کلی هدایت شوید.

    شکی نیست که ماهیت جستجو کاملاً با محتوای کار تعیین می شود. فرمول بندی یک مشکل جستجو به شما امکان می دهد منطقه و ویژگی های منابع مورد استفاده را تعیین کنید و ایجاد یک برنامه جستجو را تسهیل کنید.

    در ابتدا، جستجو با موضوع و هدف توسعه دقیق و جامع طرح آن گره خورده است، زمانی که پوشش گسترده منابع به ویژه ضروری است. سپس جستجوی اطلاعات مشخص شده و به محتوای فوری کار محدود می شود.

    در بسیار نمای کلیفرآیند بازیابی اطلاعات را می توان به مراحل تدوین مشکل جستجو، توسعه تقسیم کرد برنامه کاریجستجو، اجرای جستجو و ارائه نتایج آن.

    و در پایان خاطرنشان می کنیم که در هر صورت، تنها با مطالعه سیستماتیک و هدفمند، دانش و توانایی به کارگیری منطقی یک سیستم بازیابی اطلاعات، یک متخصص مدرن می تواند از اثربخشی و کیفیت کار خود مطمئن باشد.

    فهرست منابع

    1. Borodkin L.I., Vladimirov V.N., Garskova I.M. ABC اینترنت آدرس دهی اینترنتی جستجوی منابع اطلاعاتی در شبکه در دفتر//تاریخ جدید و اخیر. 1999. شماره 1.

    2. Braichevsky S.M. مدرن جریان اطلاعات: مسائل جاری//اطلاعات علمی و فنی. Ser.1. 2005. شماره 11.

    3. گرچیخین A.A. اکتشافی کتابشناختی. - م.: 1984.

    4. Comer D. اصول اینترنت. دوره آموزشی. - سن پترزبورگ: 2002.

    5. کوزنتسوف I.N. اطلاعات: جستجو، تجزیه و تحلیل، حفاظت. - م.: 2004.

    6. Lande D.V. جستجوی دانش در اینترنت کار حرفه ای - م.: 2005.

    7. Parshukova G.B. سواد اطلاعاتی به عنوان عاملی در توسعه شایستگی حرفه ای. فن آوری های جامعه اطلاعاتی - اینترنت و جامعه مدرن: مجموعه مقالات هشتم کنفرانس مشترک همه روسیه (سن پترزبورگ، 8-11 نوامبر 2005). - سن پترزبورگ: دانشکده فیلولوژی دانشگاه دولتی سن پترزبورگ، 2005.

    8. Prokhorov A. جستجوی موثر در اینترنت // مطبوعات کامپیوتر. 2006. شماره 2.

    9. استپانوف V.K. جستجوی کتابشناختی در اینترنت//کتابشناسی. 1998. شماره 1.

    10. Talantov M. جستجوی حرفه ای در اینترنت: برنامه ریزی روش جستجو // Computer-press. 1999. شماره 8.

    11. Tatarnikov O. فن آوری های جدید جستجوی اینترنتی//ComputerPress. 2005. شماره 10.

    12. Toffler B.E., Imber J. Dictionary of Marketing Terms. - م.: 2000.

    13. Yatsenko N.E. فرهنگ توضیحی اصطلاحات علوم اجتماعی. - سن پترزبورگ: 1999.

    ارسال شده در Allbest.ru

    اسناد مشابه

      ویژگی های جستجوی اطلاعات در اینترنت: استراتژی و روش. موتورهای جستجو، کاتالوگ ها و پورتال های منابع اطلاعاتی. انتخاب و معرفی کلمات کلیدی. با استفاده از حالت «جستجوی پیشرفته» که هر یک از موتورهای جستجوی اینترنتی دارند.

      چکیده، اضافه شده در 1393/08/06

      مفهوم و اصول عملکرد، ساختار داخلی و عناصر، تاریخچه شکل گیری و توسعه موتور جستجوی "رامبلر". تحقیق و تحلیل و همچنین ارزیابی اثربخشی این موتور جستجو برای جستجوی اطلاعات اقتصادی در اینترنت.

      کار دوره، اضافه شده 05/10/2015

      مطالعه طبقه بندی ابزارهای جستجو بر اساس V.V. دودیخین. یافتن اطلاعات با استفاده از منابع جستجو تشکیل درخواست ها استفاده از کلمات کلیدی نمایه سازی اسناد میزبانی شده در سرورهای مختلف. رهبران خارجی موتورهای جستجو

      ارائه، اضافه شده در 03/10/2015

      ویژگی های پایگاه داده های اصلی ثبت اختراع مورد استفاده در هنگام انجام جستجوی اطلاعات ثبت اختراع در اینترنت. استراتژی جستجوی پتنت و سیستم های طبقه بندی پتنت استفاده از عملگرهای منطقی و کلمات کلیدی هنگام جستجو

      ارائه، اضافه شده در 2011/09/15

      تاریخچه موتورهای جستجو طبقه بندی سیستم های اطلاعاتی بر اساس درجه اتوماسیون. سه راه اصلی برای جستجوی اطلاعات در اینترنت. تفاوت بین موتورهای جستجو و دایرکتوری ها هدف و انواع سیستم های اطلاعاتی نهادهای دولتی.

      کار دوره، اضافه شده در 2015/05/13

      تکنیک های جستجوی اطلاعات در اینترنت جستجو بر اساس آدرس شناخته شده، ساخت کاربر از آدرس. سیستم های بازیابی اطلاعات ویژه: طبقه بندی (روبریکاتورها) و فرهنگ لغت. جستجوی منابع اطلاعاتی در زمینه های مختلف.

      چکیده، اضافه شده در 04/03/2010

      رشد حجم اطلاعات در جهان، افزایش آن در اینترنت در پیشرفت هندسی. تعداد سایت های ثبت شده در موتور جستجوی Yandex. ویژگی های جستجوی موثر اطلاعات در اینترنت. نمودار جریان اطلاعات

      ارائه، اضافه شده در 2013/08/27

      ویژگی های روش های جستجوی اطلاعات در اینترنت، یعنی استفاده از لینک های فرامتن، موتورهای جستجو و ابزارهای خاص. تجزیه و تحلیل منابع جدید اینترنتی تاریخچه پیدایش و شرح موتورهای جستجوی غربی و روسی زبان.

      چکیده، اضافه شده در 2010/05/12

      دلیل انتخاب روش استخراج کلمه کلیدی تجزیه و تحلیل حوزه موضوعی، طراحی یک سیستم اطلاعاتی برای جستجوی اسناد مربوطه. پیاده سازی پرس و جو در کتابخانه های دیجیتال. پیاده سازی رابط سیستم برای جستجوی اسناد مربوطه.

      پایان نامه، اضافه شده در 2016/09/21

      شبکه جهانی وب مجموعه ای از منابع اطلاعاتی است که توسط ارتباطات راه دور و بر اساس نمایش فرامتنی داده ها به هم متصل شده اند. جستجوی اطلاعات در اینترنت. تعیین منطقه جستجو با برجسته کردن کلمات کلیدی.

    فن آوری های جستجو

    قوانین اصطکاک و انتقال گرما و جرم در یک لایه مرزی متلاطم

    انواع مختلفی از نمایش "قانون اصطکاک" (برای مورد مرجع) وجود دارد که منجر به نتایج تقریباً یکسانی می شود. مطابق با مفهوم یک لایه مرزی "لگاریتمی" (به مقدار اولین ثابت آشفتگی χ = 0.4) قانون اصطکاک برای تلاطم بسیار توسعه یافته با "ویسکوزیته محو" به خوبی با فرمول ساده کارمان تقریب می شود:

    برای نمایش قدرت-قانون پروفیل سرعت، فرمول زیر باید پیشنهاد شود:

    کجا: ; n- توان پروفیل سرعت؛

    – ضریب نیمه تجربی

    الف- ضریب تجربی

    δ - ضخامت لایه مرزی

    استفاده از روابط برای اعداد رینولدز ساخته شده بر روی مقادیر خطی مختلف:

    توجه به این نکته ضروری است که در مورد ایجاد یک لایه مرزی متلاطم از لبه جلویی ( x cr = 0) قانون اصطکاک نیز باید به شکل زیر ارائه شود:

    مقادیر پارامتری فرمول های ارائه شده برای پروفیل های سرعت مختلف در جدول خلاصه شده است.

    پارامتر n
    1/7 1/8 1/9 1/10
    الف 8,74 9,71 10,6 11,5
    0,0975 0,089 0,0818 0,0757
    1,28 1,25 1,22 1,20
    متر 0,250 0,222 0,200 0,182
    ب 0,0252 0,0206 0,0190 0,0148
    متر 1 0,200 0,182 0,167 0,154
    ب 1 0,0576 0,0450 0,0362 0,0308

    اشکال دیگر نمایش قانون اصطکاک نیز شناخته شده و مورد استفاده قرار می گیرد که عملاً به نتایج مشابهی منجر می شود. بنابراین V.M. ایولف یک تقریب را پیشنهاد کرد:

    فرمول های قوانین انتقال گرما و جرم از "قوانین اصطکاک" برای شرایط استاندارد (مورد مرجع) با استفاده از اصل قیاس سه گانه معروف رینولدز به دست می آیند.

    کجا: اس– ضریب تصحیح – ضریب قیاس رینولدز برای عدم انطباق با شرایط استاندارد (و)، عامل اسبه عنوان اولین تقریب، به طور رضایت بخشی توسط رابطه تقریب می شود:

    توجه به این نکته مهم است که در مورد استفاده از پارامترهای انتگرال، "قوانین" انتقال گرما و جرم به خوبی توسط وابستگی ها توصیف می شوند:

    فناوری وب شبکه جهانی وب (WWW) یک فناوری ویژه برای تهیه و ارسال اسناد در اینترنت در نظر گرفته می شود. WWW شامل صفحات وب، کتابخانه های الکترونیکی، کاتالوگ ها و حتی موزه های مجازی است! با چنین فراوانی اطلاعات، این سوال مطرح می شود: "چگونه در چنین فضای اطلاعاتی عظیم و بزرگی حرکت کنیم -" ابزارهای جستجو در حل این مشکل به کمک می آیند.

    ابزارهای جستجو نرم افزارهای خاصی هستند که هدف اصلی آنها ارائه بهینه ترین و باکیفیت ترین جستجوی اطلاعات برای کاربران اینترنت است. ابزارهای جستجو بر روی وب سرورهای خاصی میزبانی می شوند که هر کدام عملکرد خاصی را انجام می دهند:

    1. تجزیه و تحلیل صفحات وب و وارد کردن نتایج تجزیه و تحلیل به یک سطح از پایگاه داده سرور جستجو.

    2. جستجوی اطلاعات بر اساس درخواست کاربر.

    3. ارائه رابط کاربری مناسب برای جستجوی اطلاعات و مشاهده نتایج جستجو توسط کاربر.

    تکنیک‌های کاری که هنگام کار با یک ابزار جستجو استفاده می‌شود تقریباً یکسان است. قبل از بحث درباره آنها، اجازه دهید مفاهیم زیر را در نظر بگیریم:

    1. رابط ابزار جستجو در قالب یک صفحه با لینک ها، یک خط پرس و جو (خط جستجو) و ابزارهای فعال سازی پرس و جو ارائه می شود.

    2. فهرست موتور جستجو - پایگاه اطلاعاتی حاوی نتیجه تجزیه و تحلیل صفحات وب، که بر اساس قوانین خاصی گردآوری شده است.

    3. Query - کلید واژه یا عبارتی که کاربر در نوار جستجو وارد می کند. برای تشکیل پرس و جوهای مختلف، از کاراکترهای ویژه (""، ~) و نمادهای ریاضی (*، +، -) استفاده می شود.

    طرح جستجوی اطلاعات ساده است. کاربر یک عبارت کلیدی را تایپ می کند و جستجو را فعال می کند، بنابراین مجموعه ای از اسناد را بر اساس درخواست فرموله شده (مشخص شده) دریافت می کند. این فهرست اسناد بر اساس معیارهای خاصی رتبه بندی می شود به طوری که در بالای لیست اسنادی قرار دارند که بیشترین مطابقت را با درخواست کاربر دارند. هر یک از ابزارهای جستجو از معیارهای مختلفی برای رتبه‌بندی اسناد استفاده می‌کنند، هم هنگام تجزیه و تحلیل نتایج جستجو و هم هنگام ایجاد یک فهرست (پر کردن پایگاه داده فهرست صفحات وب).

    با این حال، اگر یک پرس و جو با طرح مشابه را در نوار جستجو برای هر ابزار جستجو مشخص کنید، می توانید نتایج جستجوی متفاوتی دریافت کنید. برای کاربر اهمیت زیادی دارد که کدام اسناد در دو تا سه دوجین سند اول در نتایج جستجو ظاهر می شوند و این اسناد چقدر با انتظارات کاربر مطابقت دارند.

    اکثر ابزارهای جستجو دو روش جستجو را ارائه می دهند - جستجوی ساده(جستجوی ساده) و جستجوی پیشرفته(جستجوی پیشرفته) با یا بدون فرم درخواست خاص. بیایید هر دو نوع جستجو را با استفاده از مثال یک موتور جستجوی انگلیسی زبان در نظر بگیریم.

    به عنوان مثال، استفاده از AltaVista برای درخواست‌های دلخواه، «چیزی در مورد مدرک آنلاین در فناوری اطلاعات» راحت است، در حالی که ابزار جستجوی یاهو به شما امکان می‌دهد اخبار جهان، اطلاعات مربوط به نرخ ارز یا پیش‌بینی آب‌وهوا را دریافت کنید.

    تسلط بر معیارهای اصلاح پرس و جو و تکنیک های جستجوی پیشرفته به شما امکان می دهد کارایی جستجو را افزایش دهید و به سرعت اطلاعات لازم را پیدا کنید. اول از همه، می توانید با استفاده از عملگرهای منطقی (عملیات) یا، And، Near، Not، ریاضی و نمادهای خاص در جستارهای خود، کارایی جستجوی خود را افزایش دهید. با استفاده از عملگرها و/یا نمادها، کاربر کلمات کلیدی را به ترتیب مورد نیاز به هم مرتبط می کند تا مناسب ترین نتیجه جستجو را برای پرس و جو به دست آورد. یک پرس و جو ساده تعداد زیادی لینک به اسناد نمی دهد، زیرا این فهرست شامل اسنادی است که حاوی یکی از کلمات وارد شده در طول درخواست یا یک عبارت ساده است (جدول 1 را ببینید). عملگر و به شما اجازه می دهد تا مشخص کنید که تمام کلمات کلیدی باید در محتوای سند گنجانده شوند. با این حال، تعداد اسناد هنوز باید زیاد باشد و بررسی آنها مدتی طول می کشد. به همین دلیل، در برخی موارد استفاده از عملگر زمینه در نزدیکی بسیار راحت تر است، که نشان می دهد کلمات باید در مجاورت کافی در سند قرار گیرند. استفاده از نزدیک به میزان قابل توجهی تعداد اسناد یافت شده را کاهش می دهد. وجود کاراکتر "*" در رشته پرس و جو به این معنی است که کلمه با ماسک آن جستجو می شود. برای مثال، اگر در رشته پرس و جو بنویسیم «gov*»، فهرستی از اسناد حاوی کلماتی که با «gov» شروع می‌شوند، دریافت می‌کنیم. اینها عبارتند از دولت، استاندار و ....

    توسعه یافته ترین سرویس جستجو برای اطلاعات به زبان روسی توسط سرور جستجوی Yandex ارائه می شود. در Yandex، می‌توانید به سادگی عبارتی به زبان روسی بنویسید که توضیح می‌دهد آنچه می‌خواهید پیدا کنید، و سیستم درخواست شما را تجزیه و تحلیل و پردازش می‌کند و سپس سعی می‌کند هر چیزی را که به موضوع داده شده مربوط می‌شود، پیدا کند. با استفاده از عملگرهای خاص، می‌توانید رشته‌ای ایجاد کنید که به موتور جستجو توضیح می‌دهد که نیازهای شما برای اطلاعاتی که به آنها علاقه دارید چیست. برخی از اپراتورهای زبان جستجوی Yandex را می توان در اینجا مشاهده کرد: http://help.yandex.ru/search/ -id=481939

    موتور جستجوی نه چندان محبوب Rambler آمار مربوط به ترافیک پیوندها را از همان عملگرهای منطقی AND، OR، NOT، متاسامبل * (شبیه به کاراکتر * در AltaVista که محدوده پرس و جو را گسترش می دهد)، ضرایب نمادها + و - نگه می دارد. برای افزایش یا کاهش اهمیت کلمات وارد شده در پرس و جو پشتیبانی می شوند.

    بیایید به محبوب ترین فناوری ها برای جستجوی اطلاعات در اینترنت نگاه کنیم.

    مبحث 3 کار با موتورهای جستجوی اینترنتی

    بررسی ها