无为而为
wget 文件同步 分类:技术备忘
阅读:12571
评论:1
之前曾经使用过FTPSync进行非实时网站同步的实现,结果发现wget已有类似功能,而且更加简单
例如:
wget -m --no-remove-listing -nH -P /home/xxx/bak/ ftp://username:password@www.xxx.com/*
务必注意最后ftp路径后面有个*,否则wget只会下载生成一个目录列表文件index.html,而不会同步文件
参数含义:
-m 开启单向镜像
--no-remove-listing 不生成目录列表文件index.html
-nH 不创建以主机名命名的目录
-P 下载保存路径
wget很强大,可以做很多参数配置,例如:
-w 下载间隔时间
-X 排除某些目录
......
-----------以下2009-11-05 23:00添加-----------
wget只能实现下载,远程如果删除了文件,本地不会同步删除,比较适合一次性将文件全部抓取回来或者不需要删除的情况;FTPSync则可以同步删除。
无为而为
seo 分类:技术备忘
阅读:5205
评论:1
索引擎优化(SEO)是当前互联网研究的一个热点,基本方法是通过优化站点页面的关键内容输出、在其他优秀站点导入链接(从外部网站的页面上链回您的网站的链接)等方法,提高搜索引擎对于站点的“识别能力”和给予更高的评分。
针对搜索效果较差的情况,可采取相关的优化有:
1、站点根目录建立robots.txt,显示声明搜索路径,并提供sitemap链接,帮助搜索引擎“找门”,例如
User-agent: *
Disallow: /admin/
Allow: /blog/
Sitemap: http://www.xxx.com/sitemap.xml
2、定期生成站点地图sitemap文件,声明站点内容和更新周期,帮助搜索引擎“识路”,例如
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.xxx.com/index.jsp</loc>
<lastmod>2009-02-06T08:36:00+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.xxx.com/a.jsp</loc>
<lastmod>2009-02-06T08:36:00+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<loc>http://www.xxx.com/singer/837/</loc>
<lastmod>2008-08-31T03:32:10+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>
<url>
<loc>http://www.xxx.com/bussiness/686/</loc>
<lastmod>2007-10-11T16:07:19+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.4</priority>
</url>
<url>
<loc>http://www.xxx.com/song/3/</loc>
<lastmod>2003-08-30T17:12:38+00:00</lastmod>
<changefreq>yearly</changefreq>
<priority>0.2</priority>
</url>
</urlset>
3、优化链接架构,便于浏览
- 确保网页只需通过首页的几次点击就能到达;
- 符合用户习惯的导航设置:在首页可通过你提供的导航链接找到想要的信息:用户如果是通过一个外部链接找网站的,首先到达的不一定是首页,要确保他们能够顺利的找到首页及其他相关部分的链接;
- 为搜索引擎设置可抓取的链接:文字链接是很容易被搜索引擎发现的;
- 使用描述性定位文字:也就是通常看到的在链接中可以点击的词语,是一个对搜索引擎和用户很有帮助的信号;
- 导航中尽量使用文字链;
- 使用面包屑(breadcrumb)式的导航模式,例如“首页 > 彩铃 > 免费专区“;
- 更好的链接锚文本(anchor text):锚文本是链接上可以被点击的文字,通常被放在锚标记<a href="..."></a>中,文字要简短、清晰;
4、图片优化:
- 图片链接增加alt属性的描述,并使用简短但是描述性很强文字;
- 当图片作为链接使用时,一定要提供alt文本;
- 将图片保存在一个专用的目录下;
5、更好的元描述来改善页面摘要
- 为每个网页创建独特的标题标签,在描述中明确包含标记性事实,准确描述网页内容;
- 创建独特、准确的页面标题:重视<title>页面标题</title>和<meta name="description" content="本页的描述">:多数搜索引擎以此作为页面搜索的主要内容信息来源,description一般会显示在搜索结果的页面描述内容中;
6、优化URL结构:搜索引擎长于抓取各类型的URL结构
- 在URL中使用单词:URL中的单词也会被作为搜索的依据之一;
- 使用简单的目录结构:目录结构应该能够很好地归纳网站内容,并且使用户轻松地知道处于网站的哪个位置;
- 为同一文档提供统一的URL;
- 动态URL重写为静态URL;
7、建立有用的404网页:用户偶尔会因点击失效的链接或输入错误的URL而访问一些在不存在的页面,使用自定义404网页能有效地帮助用户回到网站中有效页面,将大大提高用户体验;自定义404网页中可提供回到主页的链接,热门内容页面的链接和站内搜索的功能。
除开内容,其他优化方法:
1、在优秀的网站上导出外链
2、充分利用免费的网站管理员工具http://www.google.cn/webmasters/
- 使用工具分析网站搜索情况,作出对应改进
- 当网站在Google上产生网站链接后,使用“网站管理员工具>控制台>链接>网站链接”功能,维护网站链接;
SEO是个漫长的过程,优化的效果需要一定时间才能反映,要有耐心,而且要反复、持续的进行~~
参考资料:
1、http://www.googlechinawebmaster.com
2、《Google's Search Engine Optimization Starter Guide》
下载
3、http://www.seotest.cn
4、http://www.seo168.com
5、http://www.seowhy.com
无为而为
分类:技术备忘
阅读:6304
评论:5
现在在用一台Lenovo的X200,感觉质量还是比原来IBM差些,用了一个月多点,已经莫名蓝屏2次了。
另外还有一个令我不爽的问题就是,经常会提示虚拟内存不足(我设置了4GB),也没有发现中毒,关了很多无用的服务也无效,单从任务管理器里面看,最大的程序也就只占用了几十兆,找了很多工具,例如procexp来观察也没能发现问题,只好用1-2天就重启。
有时间了又来研究,终于还是让我找到了问题,原来是指纹认证服务的问题,虽然任务管理器中看只占用了2xMB的虚拟内存,但是一旦重启这个服务,虚拟内存就会从3.xGB的占用量猛降到600MB左右。Google了一下,有人说是在XP SP3可能有这样的问题,最新的程序也一样,不管如何了,发现问题就好办,写个批处理放到XP的计划任务里面定时重启"AuthenTec Fingerprint Service"服务就暂时将就用吧,等新版本升级来解决咯。
RestartService.bat
net stop "AuthenTec Fingerprint Service"
net start "AuthenTec Fingerprint Service"
当然,如果你不使用指纹识别功能,可以把这个服务禁用掉,我还是蛮喜欢这个功能的,所以只好这样解决了。