你的位置:首页 > Java教程

[Java教程]基于JSP的RSS阅读器的设计与实现


 

阅读器访问地址:http://easyrss.tk/,欢迎体验!

阅读导览

一、    概述 

二、    设计的基本概念和原理 

三、    设计方案

四、    主要源代码 

五、    阅读器使用说明

概述

获得信息是在人类的生活中是必不可少的环节。如果现在的社会对获得信息不快捷,那么这个社会将不会像如今这般的发达和进步。在当今网络技术相当发达的今天,大量的信息充斥在网上。现在网络越来越发达,用户在网上既能工作也能娱乐。当用户在网上需浏览很多个网站才能获取自己多需的信息时,那就感觉很累。因为现在每个网站都有很多信息,找到自己所喜欢的并不是一件轻松的事。这时RSS阅读器的功用就体现出来了。

RSS 是一种简单的订阅方式,它能能够起到聚合网络信息的作用。就像订报纸、杂志一样,您可以订阅任何喜欢的内容。网络用户可以在客户端借助于支持RSS的新闻聚合软件在不打开网站内容页面的情况下,将网站提供的支持RSS输出的网站内容(新闻、Blog等)聚集到RSS阅读器中,用户可以不必登录各个提供信息的网站,而通过"RSS阅读器"来阅读这些内容。 

本设计要设计一个RSS阅读器,本阅读器将要实现的功能如下:

  • 随时随地阅读:

通过注册与登录将用户信息保存到服务器,用户在任何时间、任何地方打开网页就可以阅读自己的RSS订阅。

  • RSS源的分组管理与结构化显示:

简洁直观的分类显示用户的RSS订阅列表,简化操作、提高用户的阅读体验。

  • RSS源的添加、修改与删除:

用户能够方便的添加、修改、删除RSS源及分组。

  • RSS源的的解析与显示:

阅读器可以通过用户提供的RSS源URL解析出该RSS源的标题、包含的文章列表、文章地址和文章更新时间等信息,并且能正确地以一定格式显示出来供用户阅读。

设计的基本概念和原理

 

RSS与RSS阅读器概念

  • RSS:

RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,是使用最广泛的【1】。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的【2】。但其实这三个解释都是指同一种Syndication的技术。

RSS目前广泛用于网上新闻频道,blog和wiki,主要的版本有0.91, 1.0, 2.0。使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。

  • RSS阅读器:

RSS阅读器基本可以分为三类【3】:

第一类大多数阅读器是运行在计算机桌面上的应用程序,通过所订阅网站的新闻供应,可自动、定时地更新新闻标题。在该类阅读器中,有Awasu、FeedDemon和RSSReader这三款流行的阅读器,都提供免费试用版和付费高级版。

第二类新闻阅读器通常是内嵌于已在计算机中运行的应用程序中。例如,NewsGator内嵌在微软的Outlook中,所订阅的新闻标题位于Outlook的收件箱文件夹中。另外,Pluck内嵌在Internet Explorer浏览器中!

第三类则是在线的WEB RSS阅读器,其优势在于不需要安装任何软件就可以获得RSS阅读的便利,并且可以保存阅读状态,推荐和收藏自己感兴趣的文章。提供此服务的有两类网站,一种是专门提供RSS阅读器的网站,例如国外的feedly,国内的有道、鲜果、抓虾;另一种是提供个性化首页的网站,例如国外的netvibes、pageflakes,国内的雅蛙、阔地。

本阅读器即是基于JSP的WEB RSS阅读器。

 

阅读器实现原理

本RSS阅读器使用主要使用JSP技术,根据用户请求的Url借助Rome和Jdom开源工具来解析【4】。同时用数据库与JSP相应技术实现阅读器功能的扩展,如:用户阅读列表的管理,显示效果的优化等。

设计方案

架构设计

网站前台使用JSP技术实现页面与功能,后台数据库使用SQLServer作数据管理,阅读内容从RSS源获取,如下图:

 

数据库设计

数据库使用SQL Server 2008 R2,数据表设计如下:

为保护系统安全,数据表结构不直接给出

 

界面设计

登录与注册:

登录界面 login.jsp

 

注册界面signup.jsp:

 

主页

主页index.jsp(中间的分割线可以拖动)

主页采用框架设计,上部为网站信息和当前用户信息;左边为RSS源列表;右边是主框架,用于显示阅读内容。左右框架大小可以拖动随意调整。

RSS树形列表:

dtree

RSS源显示采用dtree树形列表【5】展示,能够直观展示分组与分组中的RRS源。

文章列表:

以表格形式列出选定RSS订阅中的文章列表

文章内容:

文章内容

文章内容是直接展示文章原网页,保持原文排版,并防止被屏蔽。

添加与管理:

添加与管理都采用弹窗的方式,具体如下:

添加源

添加分组

管理分组

管理源

修改界面与添加界面相似,不再贴图。

提示信息(tips.jsp):

大部分提示信息由tips页面显示,举例如下:

注册提示

未登录提示

退出提示

……

提示页面会根据获取到的参数显示提示信息

功能设计

注册:

注册时,用户名、密码以及确认密码为必填项。由于密码不可见,设置确认密码可以防止输入错误。昵称为选填项,用以更加友好的显示用户名称,若为空显示时将以用户名代替。注册后将注册信息添加到数据库。同时应注意用户名不能和数据库中已有的用户名重复。

登录:

登录时首先获取用户名,连接数据库,查询该用户是否存在,若用户名不存在,跳转提示页面显示相应提示然后返回至登录页面。如果查找到,则再确认密码是否输入正确,密码正确则将用户uid存入session以备后面使用然后跳转至该用户主页。

主页:

主页采用框架布局,主要包括三个部分:

  • 上部:显示网站logo,当前用户信息等。用户信息根据session中的uid从数据库中查询该用户的详细信息。若该用户昵称列表不为空则显示昵称,若为空则显示用户名。
  • 左部:主要是RSS树形列表,详细见后文介绍;
  • 右部:主要显示区域,显示文章列表及文章具体内容,详细见后文介绍。

RSS树形列表:

RSS源显示采用开源的dtree项目进行二次开发。首先根据之前放入session中的uid获取当前用户的RSS分组数据,每获取到一个分组就根据该分组的gid获取属于该组内的的RSS源数据,然后将数据放入dtree中,依次循环直至获取到所有数据。最后由dtree根据获取到的数据按照树形样式显示出来。用户点击列表中的项目将会在右侧主框架中打开相应的文章列表。

主框架的文章列表:

主框架从左框架中发来的链接中提取feed参数中的url值,解析该url获取到相应文章列表。对url和

同时,为了解决部分文章不支持在框架中打开,文章列表设计了在新窗口打开的选项。主要实现方法是:用户改变"在新窗口中打开"的选项的状态后,js立即将该选项状态写入Cookie并发送刷新请求。服务器根据Cookies值动态修改文章链接的target属性并向客户端发送新的页面。

文章内容显示:

文章内容未做任何处理直接显示原文,简单方便。但是有些文章不支持在框架中显示,这时需要勾选"在新窗口中打开"的选项,使文章在新开的浏览器窗口中显示。

RSS源的添加与管理:

添加分为添加源与添加分组,两个界面属于同一个弹窗,通过顶部tab切换,直观快捷。

添加源时需要提交:Feed地址、标题、分组。feed地址填写需要订阅的rss地址;标题可以从Feed地址中提取(具体实现方式为服务器获取到feed地址,根据feed地址解析出订阅标题,然后向客户端发送带有订阅标题的新页面);分组通过列表框选择用户已有的分组。客户端提交表单后,服务器获取到相应的信息并添加至数据库,然后返回成功信息;用户可再次添加新的源。

添加分组时只需要提交需要添加的分组名称即可。

管理界面属于新的弹窗,初始显示用户的所有分组,每个分组包含"展开"、"修改"和"删除"三个菜单。点击分组名或"展开"菜单将会跳转到该分组下的RSS源列表。RSS源列表与分组列表相识,每个分组包含"修改"与"删除"两个菜单。

修改时提交需要修改的项目,服务器根据获取到的gid、lid以及修改后的信息更新对应项目数据并返回相应提示。

删除时提交对应分组的gid或RSS源的lid,服务器根据获取到的id信息输出相应项目并返回提示。删除非空分组时将会删除该分组下所有RSS源(有提示)。

提示信息:

提示信息显示页面或根据获取到的参数显示相应的提示信息并在延迟特定时间后跳转到相应界面,参数为空时显示"未知错误"并跳转至主页。

网络安全补充

为了保护网站与用户数据安全,采取了一下辅助安全措施:

  • 注册输入限制:

用户名只能为字母与数字的组合

密码长度太短

用户名限制为字母与数字组合,防止用户使用SQL语言中的符号进行SQL注入。密码长度限制为8~20位。太短,密码不安全;太长,用户可以通过密码框使用SQL注入攻击

  • 使用过滤器防止SQL注入:

只通过表单的输入限制来防止SQL注入是远远不够的,用户依然可一使用URL参数的形式进行注入攻击。所以我在原项目中加入了一个过滤器来防护一些简单的SQL注入攻击。

该过滤器的原理是,截取用户的所有输入,检测是否是否包含特定关键词,有则重定向到一个错误信息页面error.jsp。没有则通过过滤器。

当然只是用过滤器是不能完全防护SQL注入攻击的,更有效的方式是项目中所有SQL语句都采用预编译语句(PreparedStatement)接口来实现【6】

面对日益复杂的网络安全环境,以上的安全措施只是简单的做了一些防护,对于一个实际项目是远远不够的。在实际的项目还用采取更加严谨,更加有效的措施。

具体方法参考本文:JSP使用过滤器防止SQL注入

 主要源代码

视图部分/RSSreader/WebContent/rsscontent.jsp:<%@page contentType="text/html"%><%@page pageEncoding="UTF-8" import="java.text.SimpleDateFormat"%><html><script language=javascript>function setCheck(){  var newWindow=document.getElementById("newWindow").value;  if(newWindow==0)  {    document.getElementById("check").checked=true;  }  else  {  document.getElementById("check").checked=false;  }} function check(){var check=document.getElementById("check").checked;var feed=document.getElementById("feed").value;var url="rsscontent.jsp?feed="+feed;if(check)  {  document.cookie="newWindow=0";  }else  {  document.cookie="newWindow=1";  }self.location=url;}</script> <body onload="setCheck()"> <%String pageTitle="";String urlStr = request.getParameter("feed");String target=""; Cookie cookies[]=request.getCookies(); //读出用户硬盘上的Cookie,并将所有的Cookie放到一个cookie对象数组里面Cookie sCookie=null;for(int i=0;i<cookies.length;i++){ //用一个循环语句遍历刚才建立的Cookie对象数组sCookie=cookies[i]; //取出数组中的一个Cookie对象if(sCookie!=null){   if(("newWindow").equals(sCookie.getName())){   pageContext.setAttribute("newWindow",sCookie.getValue());   System.out.println(pageContext.getAttribute("newWindow"));   }}}if(pageContext.getAttribute("newWindow")!=null){if(pageContext.getAttribute("newWindow").equals("0")){  target="_blank";}else{  target="_self";}} try{/* java.util.Properties systemSettings = System.getProperties();systemSettings.put("http.proxyHost", "mywebcache.com");systemSettings.put("http.proxyPort", "8080");System.setProperties(systemSettings); */if (!urlStr.startsWith("http://"))    urlStr = "http://"+request.getParameter("feed");//String urlStr = "http://feed.cnblogs.com/blog/u/249598/rss";System.out.println(urlStr);java.net.URLConnection feedUrl = new java.net.URL(urlStr).openConnection();feedUrl.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");com.sun.syndication.io.SyndFeedInput input = new com.sun.syndication.io.SyndFeedInput();com.sun.syndication.feed.synd.SyndFeed feed = input.build(new com.sun.syndication.io.

  阅读器使用说明

注册与登录

使用阅读器之前需要注册用户并登录,服务器会保存用户的RSS列表数据。未登录之前阅读器会推荐阅读阅读列表,并指导用户寻找RSS源,如下图:

注册时输入为空或输入错误会有相应提示

注册成功后会提示用户记住用户名,然后跳转登录页面:

登录后来到主页,同样阅读器会引导新用户寻找RSS源,点击"寻找RSS源"会跳转到下面这样一个神奇的页面:

然后就是添加自己需要订阅的RSS源了。

添加与管理RSS源

注册登录后,就可以添加自己喜爱的RSS源了。点击添加,弹出添加对话框,这是我们需要先添加分组再添加RSS源。我们先添加两个测试分组,如下图:

添加成功会有提示:

添加好分组后再来添加RSS源,我们测试添加一个"知乎每日精选"的订阅:www.zhihu.com/rss 直接在浏览器中打开是这样的:

这个当然看不懂,我们将url粘贴到阅读器中,标题可以不用自己填,点击"从Feed中获取",阅读器会根据url从RSS源中解析出RSS源的标题。选择"测试分组1",保存。

第一个源已经添加成功了,接下来再添加几个源用作测试。

添加完成后,关闭对话框,左边列表会自动刷新,点击展开显示已添加的RSS源:

这样我们就完成了RSS源的添加。如果有些源名字、分组有错或者源失效了、自己不想再订阅了,我们可以对其进行编辑或者直接删除。点击"管理",弹出管理对话框:

此时我们可以修改分组名或者将其删除:

注意:删除分组会删除该组内的所有RSS源。修改之后:

点击展开,可以显示该分组下的所有RSS源:

同样我们可以修改RSS源或者将其删除,方法与对组的操作类似,修改后:

修改完成后,关闭对话框,同样左边列表会自动刷新:

阅读文章

点击其中一个RSS源,会在右边显示出该订阅的文章列表:

然后点击文章的标题就会显示文章的具体内容:

如果勾选了"在新窗口中打开",文章将会在新的浏览器窗口中打开。

 

好了基于JSP的RSS阅读器的介绍就到这里,阅读器访问地址:http://easyrss.tk/