<br><br><div><span class="gmail_quote"></span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Message: 17<br>Date: Tue, 24 Oct 2006 14:39:14 -0400
<br>From: &quot;Michael T. Dean&quot; &lt;<a href="mailto:mtdean@thirdcontact.com">mtdean@thirdcontact.com</a>&gt;<br>Subject: Re: [mythtv-users] Google ate my recordings<br>To: Discussion about mythtv &lt;<a href="mailto:mythtv-users@mythtv.org">
mythtv-users@mythtv.org</a>&gt;<br>Message-ID: &lt;<a href="mailto:453E5DD2.30402@thirdcontact.com">453E5DD2.30402@thirdcontact.com</a>&gt;<br>Content-Type: text/plain; charset=ISO-8859-1; format=flowed<br><br>On 10/24/06 14:22, Carl Fongheiser wrote:
<br><br>&gt;&nbsp;&nbsp;On 10/24/06, Glenn Chubak &lt;<a href="mailto:glenn@saskatoon.com">glenn@saskatoon.com</a>&gt; wrote:<br>&gt;<br>&gt; &gt; I would have thought that mythweb &quot;Are you sure?&quot; dialogs would<br>&gt; &gt; have stopped the googlebot but it doesn't seem so. If anyone is
<br>&gt; &gt; interested I can post the access logs from apache.<br>&gt;<br>&gt;&nbsp;&nbsp;Those dialogs only happen if the browser is Javascript enabled.<br>&gt;&nbsp;&nbsp;Needless to say, the robots don't execute the Javascript code. For
<br>&gt;&nbsp;&nbsp;the future, you'll probably want to password-protect MythWeb. It's<br>&gt;&nbsp;&nbsp;also a good idea to put a robots.txt file at the top level of your<br>&gt;&nbsp;&nbsp;web server's document tree. For details, look here:<br>&gt;&nbsp;&nbsp;
<a href="http://www.robotstxt.org/wc/robots.html">http://www.robotstxt.org/wc/robots.html</a><br>&gt;<br>&gt;&nbsp;&nbsp;Finally, I strongly recommend not having your MythWeb installation<br>&gt;&nbsp;&nbsp;exposed directly to the Internet. That invites all kinds of trouble.
<br><br>IMHO, the robots.txt is completely useless since no robot should ever be<br>allowed into the web app (as you mentioned in the second point).&nbsp;&nbsp;Once<br>Google gets info about your site--even with a robots.txt in place--that
<br>allows Google users to identify it as a MythWeb site, some sociopathic<br>netizens will follow the Google-bot into your site and do Bad Things<br>(i.e. delete the recordings, delete channels, delete settings, set up<br>
user jobs to do evil things to your Myth box--are you starting to get<br>the idea that deleting recordings is probably the least bad thing that<br>could happen?).&nbsp;&nbsp;So, make sure you keep your Myth box out of the search<br>
engines (with appropriate authentication settings) or you're inviting<br>real trouble.<br><br>Mike<br><br></blockquote></div><br>Actually I would think if you've got a robots.txt which denies Googlebot access then it won't index the site either.&nbsp; That said, if Googlebot found your site so too will RandomBot01 which doesn't obey the 
robots.txt file.<br>