ترجمه‌ی کتاب: کیفیت داده و شگردهای پیوند رکوردها

ارسال شده توسط مسعود شریعتی | 27 Jul, 2017

اخیراً ترجمه‌ی کتابی را به صورت الکترونیکی و رایگان منتشر کرده‌ام که لینک آن را در اینجا قرار می‌دهم:

ترجمه‌ی 10 فصل اول کتاب Data Quality and Record Linkage Techniques اثر Thomas Herzog و دیگران

  ادامه مطلب

خودکارسازی مرور وب با جاوا اسکریپت

ارسال شده توسط مسعود شریعتی | 7 Feb, 2016

جاوا اسکریپت در خدمت کاربری وب

اگر شما کاربری هستید که Javascript بلد است، باید با دیگر کاربران وب فرق داشته باشید! JS فقط به درد تولید نرم‌افزار نمی‌خورد، می‌توانید از آن برای کاربری وب هم استفاده کنید، یعنی روی صفحات وبی که دیگران نوشته‌اند پردازش‌هایی انجام دهید تا آسان‌تر یا سریع‌تر قابل استفاده باشند (اگر با این زبان آشنا نیستید، پاراگراف آخر را بخوانید).

 

 

  ادامه مطلب

مقدمات بررسی محتوای متنی در وب

ارسال شده توسط مسعود شریعتی | 14 Jan, 2016

برای بررسی‌های علم‌سنجی روی وب، گاهاً نیاز است که بتوانیم روی محتوای فایل‌های PDF یک بررسیِ هرچند سطحی داشته باشیم. اولین گام در این راستا استخراج متن از درون این فایل‌ها است.

اگر محیط توسعه جاوا باشد، یک ابزار بسیار مفید به نام PDF-Box در اختیار است. به‌علاوه، ممکن است بتوان از سرویس‌های آنلاین مثل extractpdf.com نیز بهره برد.

 

استخراج برخط محتوای فایل‌های PDF

 

 

 ادامه مطلب

آشنایی با وب‌اسپم - بخش چهارم

ارسال شده توسط مسعود شریعتی | 2 Dec, 2015

وباسپم(بخش چهارم)

Web Spam

نبرد با وب‌اسپم

خزنده‌های موتورهای جستجو معمولاً اسکریپت‌ها را اجرا نمی‌کنند، زیرا این کار هم بار محاسباتی بالایی دارد و هم تست کامل اسکریپت‌ها امکان‌پذیر نیست. با این حال، تدابیر مبارزه با اسپم ساده ولی عموماً ناکافی زیادی نیز وجود دارند. مثلاً در مورد رداپوشی، خزنده می‌تواند با تنظیم مقدار User-Agent درخواست‌ها، خود را به عنوان یک مرورگر ساده‌ی وب جا بزند. همچنین بازهدایت از راه متا-تگ Refresh نیز به‌آسانی قابل تشخیص است.

کراولر موتور جستجو و جاوا اسکریپت!

   ادامه مطلب

آشنایی با وب‌اسپم - بخش سوم

ارسال شده توسط مسعود شریعتی | 21 Nov, 2015

وباسپم(بخش سوم)

Web Spam

شگردهای پنهان‌سازی

شگردهای پنهان‌سازی

پیش‌تر گفته شد که گاهی اسپمر تمایل دارد کلمات و لینک‌های اسپمی را از دید کاربر مخفی کند. در این مطلب به سه دسته از این روش‌ها اشاره می‌شود. ادامه مطلب

آشنایی با وب‌اسپم - بخش دوم

ارسال شده توسط مسعود شریعتی | 15 Nov, 2015

وباسپم(بخش دوم)

Web Spam

 

سلام. در این مطلب به ادامهی معرفی وباسپم میپردازم:

اسپم لینکی:

از آنجا که لینکها (پیوندها – Hyperlinks) نقش مهمی در تعیین میزان شهرت یک صفحه دارند، اسپمرها به اسپم لینکها روی آوردهاند. این کار به دو طریق ممکن است که در ادامهی این مطلب به شرح آنها می‌پردازیم.

الف: اسپم لینک‌های خروجی

 

اسپم لینک‌های خروجی

   ادامه مطلب

آشنایی با Web Spam

ارسال شده توسط مسعود شریعتی | 8 Nov, 2015

وباسپم

Web Spam

 

وب‌اسپم به چه معناست؟

به معنی گمراه کردن موتورهای جستجو با هدف کسب رتبه‌ی بالاتری در SERP برای صفحه‌ای که واقعاً به لحاظ کیفیت محتوایی شایستگی آن رتبه را ندارد؛ در واقع Web Spammerها دست به بی‌اخلاقی در حوزه‌ی SEO می‌زنند.

 

 ادامه مطلب

تماس با من

ارسال شده توسط مسعود شریعتی | 8 Nov, 2015

 

 

مالک وبلاگ: مسعود شریعتی

پست الکترونیک:

“Email.MasoudShariati@Gmail.com”