সাইটম্যাপ তৈরী
গুগল থেকে এক্সএমএল সাইটম্যাপ সাবমিট করার জন্য তারা পরামর্শ দেয় এতে তারা আপনার সাইট সম্পর্কে একটা পরিষ্কার ধারনা পায়।একটা এক্সএমএল সাইটম্যাপ তৈরী করা খুব সহজ,তৈরী করে গুগলে সাবমিট করলে মুহুর্তেই গুগল এটা ডাউনলোড করে এবং গুগলবট এলগরিদম অনুযায়ী ক্রাউল করে বিভিন্ন তথ্য প্রদর্শন করে,এই প্রসেসটার জন্য কয়েকদিন লাগতে পারে।
সাইটম্যাপ তৈরীর সময় প্রতিটি URL এর কয়েকটি জিনিস এক্সএমএল ট্যাগ দিয়ে উল্লেখ করে দিতে হয় যেমন গুরত্ব (Priority),সর্বশেষ কবে পেজটি পরিবর্তন করেছেন (Last modified date),পেজটি কত ঘনঘন পরিবর্তন হয় বা করবেন (change frequency),নিচে একটি সাইটম্যাপের নমুন দেয়া হল এটাতে নিজের সাইটের সব URL ঢুকিয়ে নিজের মত করে পরিবর্তন করে গুগল ওয়েবমাস্টার টুলে সাবমিট করতে পারেন।
1.
<?
xml
version
=
"1.0"
encoding
=
"UTF-8"
?>
2.
<
urlset
xmlns
=
"http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi
=
"http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation
=
"http://www.google.com/schemas/sitemap/0.84 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
>
3.
<
url
><
loc
>http://www.webcoachbd.com/</
loc
><
lastmod
>2011-02-16</
lastmod
><
changefreq
>weekly</
changefreq
><
priority
>1.00</
priority
></
url
>
4.
<
url
><
loc
>http://www.webcoachbd.com/forum</
loc
><
lastmod
>2011-01-20</
lastmod
><
changefreq
>daily</
changefreq
><
priority
>1.00</
priority
></
url
>
5.
</
urlset
>
উপরের নমুনা ম্যাপের প্রথম দুই লাইন শুধু কপি করে কোন এডিটরে (যেমন নোটপ্যাড++) পেস্ট করে দিন,এরপরের লাইনগুলির ব্যাখ্যা নিচে
1.
<?
xml
version
=
"1.0"
encoding
=
"UTF-8"
?>
2.
<
urlset
xmlns
=
"http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi
=
"http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation
=
"http://www.google.com/schemas/sitemap/0.84 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
>
(এখানে শুধু একটি বিষয় খেয়াল রাখতে হবে যে, এট্রিবিউট সহ <urlset …> ট্যাগটি সব URL লেখার শেষে </urlset> এই ট্যাগ দিয়ে শেষ করতে হবে।যেমন আমি নমুনা সাইটম্যাপে দেখুন দুটি URL এর একটি সাইটম্যাপ তৈরী করেছি তাই URL দুটির শেষে </urlset> ট্যাগ দিয়ে শেষ করেছি)
ব্যাখ্যা
<url>এর ভিতরে একটা URL এর জন্য সব এক্সএমএল ট্যাগগুলি থাকবে</url>
<loc>এখানে URL অর্থ্যাৎ পেজটির ঠিকানা</loc>
<lastmod> এখানে থাকবে পেজটি সর্বশেষ কবে পরিবর্তন করেছেন</lastmod>
<changefreq>পেজটি কত ঘনঘন পরিবর্তন করবেন সেই তথ্য</changefreq>
একটা সাইটম্যাপের গুরত্বপূর্ন অংশ নিচেরটুক
1.
<
url
><
loc
>http://www.webcoachbd.com/</
loc
><
lastmod
>2011-02-16</
lastmod
><
changefreq
>weekly</
changefreq
><
priority
>1.00</
priority
></
url
>
এখানে <loc></loc> এর ভিতর আমার সাইটের হোমপেজ এর ঠিকানা আছে আপনি আপনার সাইটের ঠিকানা দিয়ে দিন এভাবে আপনার সাইটে যতগুলি পেজ আছে সবগুলির URL একটা একটা করে কপি করে প্রতিবার উপরের অংশের <loc></loc> এর ভিতর বসিয়ে দিন।আপনার সাইটে যদি ৫০০ টা পেজ থাকে এবং এই ৫০০ পেজের জন্য ৫০০ টা URL থাকে তাহলে ৫০০ বার এই অংশ (উপরের কোডটুকু) কপি করুন এবং URL গুলি বসিয়ে দিন।
*গুগল ৫০০০০ এর বেশি এবং ১০ মেগাবাইটের চেয়ে বড় সাইটম্যাপ নেয়না।যদি সাইট এতই বড় হয় তাহলে ছোট ছোট কয়েক ভাগ করে কয়েকটা সাইটম্যাপ সাবমিট করতে পারবেন।
<changefreq></changefreq> এর ভিতর দেয়ার মত কয়কটা প্যারামিটার আছে।
never=যদি একটা পেজ তৈরী পর কখনই পরিবর্তন না করেন তাহলে এটা দিতে পারেন
yearly=যদি পেজটি প্রতি বছরে একবার পরিবর্তন করেন
monthly=যদি প্রতি মাসে পেজটি একবার পরিবর্তন করেন
weekly=যেমন আমি weekly দিয়েছি অর্থ্যাৎ আমি আমার হোমপেজ সপ্তাহে একবার পরিবর্তন করি
daily=যদি পেজটি প্রতিদিন পরিবর্তন করেন বা হয়
hourly= যদি পেজটি প্রতি ঘন্টায় ঘন্টায় পরিবর্তন হয় বা করেন
always=যদি পেজটি প্রতিনিয়তই পরিবর্তন করেন বা হয়
<priority></priority> এর ভিতর পেজটির গুরত্ব বোঝানোর জন্য সংখ্যা দেয়া হয়
1.0 যদি দেন তাহলে ধরা হবে এই পেজটি সবচেয়ে গুরত্বপূর্ন পেজ
0.1 দিলে ধরবে সবচেয়ে কম গুরত্বপূর্ন
এভাবে দিতে পারেন 0.75,0.50,0.25 ইত্যাদি।
সাইটম্যাপ তৈরীর সফটওয়ার এবং সাইট
সাইট যদি অনেক বড় হয় তাহলে এভাবে হাতে তৈরী করা সময়সাপেক্ষ এবং বিরক্তিকর,এজন্য কিছু সাইট এবং সফটওয়ার আছে যারা বিনামুল্যে আপনার সাইটের সাইটম্যাপ তৈরী করে দেবে।আপনি শুধু সাইটের হোমপেজটি বক্সে লিখে এন্টার দিবেন ব্যাস কয়েকমিনিটেই সফটওয়ার/সাইট আপনার সাইটম্যাপ হাজির করে ফেলবে।এমন একটা সাইট
সাইটম্যাপ তৈরীর একটা সফটওয়ার নিচের লিংক থেকে ডাউনলোড করতে পারেন
http://gsitecrawler.com/en/download/
গুগল ওয়েবমাস্টার টুল- ক্রাউলার একসেস লিংক
সাইটম্যাপ লিংকের পর গুগল ওয়েবমাস্টারে রয়েছে ক্রাউলার একসেস লিংক।
আপনি যদি চান আপনার সাইটের কোন অংশ গুগল বা অন্য কোন সার্চ ইন্জিন ক্রাউল না করুক তাহলে robot.txt ফাইল ব্যবহার করে করতে পারেন,এটা তৈরীর পদ্ধতি আগে দেখিয়েছি।গুগল ওয়েবমাস্টার টুলে আপনি এই robot.txt ফাইল পরীক্ষা করে দেখতে পারেন।Generate robot.txt লিংকে ক্লিক করে নতুন robot.txt ফাইল তৈরী করতে পারেন।আর Remove URL লিংকে ক্লিক করে গুগল সার্চ রেজাল্টে দেখায় এমন কোন পেজ সরিয়ে ফেলতে পারেন (হতে পারে এমন কোন পেজ আপনার সাইটে আগে ছিল এখন নেই সেক্ষেত্রে এটা কার্যকরী)
গুগল ওয়েবমাস্টার টুল-সাইটলিংক
এরপরের লিংক হচ্ছে সাইটলিংক (Sitelinks).সাইটলিংক হচ্ছে সাইটের ভিতরের পেজসমূহের লিংক।
গুগলে যদি webcoachbd লিখে এন্টার দেন তাহলে নিচের মত দেখাবে
এখানে সাইটলিংক হচ্ছে “এইচটিএমএল টিউটোরিয়াল” ,“প্রজেক্ট”, “জুমলা টিউটোরিয়াল” এই লিংকগুলি নিচে আরও আছে পুরো ছবি দেইনি।।গুগল এটা অটোমেটিক তৈরী করে থাকে,যে সাইটের সার্চ ইন্জিন অপটিমাইজেশন ভাল হয় সাধারনত সেসব সাইটের সাইটলিংক দেখায়।আপনি ইচ্ছে করলে সাইটলিংক ব্লক করে দিতে পারেন যেমন আমি কয়েকটা লিংককে ব্লক করেছি।তাহলে ঐ লিংক টি আর সাইট লিংক হিসেবে দেখাবেনা।যে লিংকটি ব্লক করতে চান সেই লিংকটি Demote this sitelink URL এই বক্সে লিখে দিতে হবে (উপরের ছবিতে দেখুন এই বক্সটি আছে)।এর উপরে আরও একটি বক্স আছে সেখানে সাইটলিংকগুলি যে শব্দ লিখলে আসে সেই লিংক বা শব্দটি দিতে হবে।
এরপরের লিংক Change of address
ধরুন আপনার www.webcoachbd.com.bd নামে একটা সাইট আছে এখন আপনি চাচ্ছেন এটা পরিবর্তন করে www.webcoachbd.com এই নাম রাখতে।এর উত্তম সমাধান হল ৩০১ রিডাইরেক্ট (301 redirect),ফলে কেউ www.webcoachbd.com.bd এই ঠিকানা টাইপ করে এন্টার দিলে চলে যাবে www.webcoachbd.com এই ঠিকানায় (সাইটে)
*এবার নতুন সাইটের মত গুগলে এই নতুন URL যোগ করে ভেরিফাই করতে হবে।