Serif WebPlus X4 WPX4-HFMINI-ENG-STA-1 Manual De Usuario

Los códigos de productos
WPX4-HFMINI-ENG-STA-1
Descargar
Página de 347
Developing Sites and 
Pages
   81
 
 
 
 
Excluding pages from indexing (Robots file) 
The objective of this method is the same as that for using a robots meta tag, but 
instead a robots.txt file is created and no robots meta tag is included in web 
pages. The robots.txt file is stored in the web site's root folder and can be viewed 
in any text editor to verify the excluded pages and folders. 
To enable a robots.txt file: 
1. 
Choose Site Properties... from the File menu. 
2. 
From the Search Engine tab, check the Create search engine robots 
file
 option. 
3. 
(For the site) To allow or prevent search engines indexing the entire 
site (check/uncheck Index pages on this site option). 
- or - 
(For a page) From page properties, to prevent search engines indexing 
the page, check Override site search engine settings, then uncheck 
the Index this page option. 
Including pages in indexing 
So far we've looked primarily at methods of excluding web pages from 
indexing. Without these controls, web pages will be indexed by discovering 
page hyperlinks and crawling through them, harvesting keywords, descriptions, 
and page text to be indexed. However, this process may not be efficient as there 
may be a limited number of inter-page hyperlinks present throughout your site. 
As a result, a search engine sitemap file (sitemap.xml) can be created to act as a 
local lookup for crawlers to begin investigating your site. The file simply lists 
pages in your site that you've decided can be indexed. The file also indicates to 
search engines when pages have been modified, informs when the search engine 
should check the page and how "important" pages are in relation to each other. 
The Sitemap method is especially good for "advertising" your site pages—with a 
greater likelihood of your pages appearing high in a user's search results. 
Just like the robots file, the setting of site and page properties creates the sitemap 
file (this is published with your site); the file is stored in the root web folder 
(perhaps alongside a robots.txt file).