今天写了一个简单的新浪新闻RSS操作类库

2024-03-20 01:38

本文主要是介绍今天写了一个简单的新浪新闻RSS操作类库,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天,有位群友问我如何获新浪新闻列表相关问题,我想,用正则表达式网页中取显然既复杂又不一定准确,现在许多大型网站都有RSS集合,所以我就跟他说用RSS应该好办一些。

 

一年前我写过一个RSS阅读器,不过,打新浪相关的XML文件看了一下,发现RSS2.0 和一年前的不大一样了,但具体怎么处理,几句话也很难讲得清楚,所以,我干脆写了一个类库给他,直接调用。

 

类库不是很复杂,主要两个功能:

一、通过新浪的根频道XML在把所有频道的信息读出来,使用递归连同子节点也读取出来。

二、指定频道URL的XML文件来获取新闻信息。

 

首先,我们写两个类,一个用于保存新闻个息,另一个用于保存频道信息。

    /// <summary>
/// 新闻记录实体
/// </summary>
[Serializable]
public  class NewsItem
{
/// <summary>
/// 新闻标题
/// </summary>
public string Title { get; set; }
/// <summary>
/// 新闻链接
/// </summary>
public string Link { get; set; }
/// <summary>
/// 作者
/// </summary>
public string Author { get; set; }
/// <summary>
/// 分类
/// </summary>
public string Category { get; set; }
/// <summary>
/// 发布时间
/// </summary>
public DateTime PubDate { get; set; }
/// <summary>
/// 描述
/// </summary>
public string Description { get; set; }
/// <summary>
/// 其它说明
/// </summary>
public string Comments { get; set; }
}


 

    /// <summary>
/// 新闻频道列表 
/// </summary>
[Serializable]
public  class OutLine
{
/// <summary>
/// 频道标题
/// </summary>
public string Title { get; set; }
/// <summary>
/// 频道文本
/// </summary>
public string Text { get; set; }
/// <summary>
/// 频道类型-RSS
/// </summary>
public string Type { get; set; }
/// <summary>
/// XML地址
/// </summary>
public string xmlUrl { get; set; }
/// <summary>
/// HTML地址
/// </summary>
public string htmlUrl { get; set; }
private List<OutLine> _olChildren = new List<OutLine>();
/// <summary>
/// 子频道
/// </summary>
public List<OutLine> ChildrenOutline
{
get { return _olChildren; }
}
}


 

好,接下来对应的两类,分别获取频道列表和新闻列表。

    /// <summary>
/// 新闻项管理类
/// </summary>
public class NewsManager
{
/// <summary>
/// 根据输入的XML地址获取新闻列表。
/// </summary>
/// <param name="xmlUrl">新闻频道的XML地址</param>
/// <returns>NewsItem的结果集合</returns>
public List<NewsItem> GetNewsItemList(string xmlUrl)
{
List<NewsItem> _myNews = new List<NewsItem>();
XElement myRoot = XElement.Load(xmlUrl);
var theItems =
from xe in myRoot.Element("channel").Elements("item")
select xe;
foreach (XElement e in theItems)
{
_myNews.Add(new NewsItem()
{
Title = (string)e.Element("title"),
Link = (string)e.Element("link"),
Author = (string)e.Element("author"),
Category = (string)e.Element("category"),
PubDate = (DateTime)e.Element("pubDate"),
Comments = (string)e.Element("comments"),
Description = (string)e.Element("description")
});
}
return _myNews;
}
}


 

    /// <summary>
/// 自动获取频道列表类
/// </summary>
public class OutlineManager
{
/// <summary>
/// 获取频道列表,包含子节点
/// </summary>
/// <param name="xmlUrl">根频道地址</param>
/// <returns></returns>
public List<OutLine> GetCannels(string xmlUrl)
{
List<OutLine> _list = new List<OutLine>();
XElement root = XElement.Load(xmlUrl);
var firstOutline = root.Element("body").Elements("outline");
foreach (XElement xitem in firstOutline)
{
OutLine myRootOutline = new OutLine
{
Title = (string)xitem.Attribute("title") ?? "",
Text = (string)xitem.Attribute("text") ?? "",
Type = (string)xitem.Attribute("type") ?? "",
xmlUrl = (string)xitem.Attribute("xmlUrl") ?? "",
htmlUrl = (string)xitem.Attribute("htmlUrl") ?? ""
};
AddChildElements(xitem, myRootOutline);
_list.Add(myRootOutline);
}
return _list;
}
private void AddChildElements(XElement xNode, OutLine ol)
{
if (xNode == null) return;
var xc = xNode.Elements("outline");
// 递归,添加子节点
foreach (XElement xe in xc)
{
OutLine outline = new OutLine()
{
Title = xe.Attribute("title").Value,
Text = xe.Attribute("text").Value,
Type = xe.Attribute("type").Value,
xmlUrl = xe.Attribute("xmlUrl").Value,
htmlUrl = xe.Attribute("htmlUrl").Value
};
ol.ChildrenOutline.Add(outline);
AddChildElements(xe, outline);
}
}
}


 

OK,简单的类库写好了,程序集名称为SinaRssAPIs_CS,然后,我们建一个程序来测试一下。

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Windows.Forms;
using SinaRssAPIs_CS;
namespace NewsApiTest
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
this.WindowState = FormWindowState.Maximized;
this.Text = "新浪RSS类库示例程序";
this.treeView1.AfterSelect += new TreeViewEventHandler(treeView1_AfterSelect);
this.dataGridView1.AutoGenerateColumns = false; //不自动创建列
//添加列
DataGridViewTextBoxColumn colTitle = new DataGridViewTextBoxColumn();
colTitle.HeaderText = "新闻标题";
colTitle.DataPropertyName = "Title";
this.dataGridView1.Columns.Add(colTitle);
DataGridViewTextBoxColumn colDesc = new DataGridViewTextBoxColumn();
colDesc.HeaderText = "描述";
colDesc.DataPropertyName = "Description";
colDesc.Width = 280;
this.dataGridView1.Columns.Add(colDesc);
DataGridViewTextBoxColumn colDate = new DataGridViewTextBoxColumn();
colDate.DefaultCellStyle.Format = "yyyy-MM-dd";
colDate.HeaderText = "发布日期";
colDate.DataPropertyName = "PubDate";
this.dataGridView1.Columns.Add(colDate);
DataGridViewTextBoxColumn colAuthor = new DataGridViewTextBoxColumn();
colAuthor.HeaderText = "发布者";
colAuthor.DataPropertyName = "Author";
this.dataGridView1.Columns.Add(colAuthor);
DataGridViewTextBoxColumn colLink = new DataGridViewTextBoxColumn();
colLink.DataPropertyName = "Link";
colLink.Name = "link";
colLink.Visible = false;
this.dataGridView1.Columns.Add(colLink);
this.dataGridView1.SelectionChanged += new EventHandler(dataGridView1_SelectionChanged);
}
void dataGridView1_SelectionChanged(object sender, EventArgs e)
{
if (this.dataGridView1.CurrentRow == null) return;
string link = this.dataGridView1.CurrentRow.Cells["link"].Value.ToString();
this.webBrowser1.Navigate(link);
}
void treeView1_AfterSelect(object sender, TreeViewEventArgs e)
{
if (e.Node.Tag == null) return;
string xml = e.Node.Tag.ToString();
List<NewsItem> items = null;
NewsManager mg = new NewsManager();
items = mg.GetNewsItemList(xml);
this.dataGridView1.DataSource = items;
}
private void Form1_Load(object sender, EventArgs e)
{
OutlineManager omg = new OutlineManager();
List<OutLine> cnList = omg.GetCannels(@"http://rss.sina.com.cn/sina_all_opml.xml");
this.treeView1.BeginUpdate();
this.treeView1.Nodes.Clear();
//根节点
foreach (OutLine  root in cnList)
{
TreeNode tnRoot = new TreeNode();
tnRoot.Text = root.Title.Split('-')[0];
AddNodes(root, tnRoot);
this.treeView1.Nodes.Add(tnRoot);
}
this.treeView1.EndUpdate();
}
private void AddNodes(OutLine ol, TreeNode nd)
{
foreach (OutLine oits in ol.ChildrenOutline)
{
TreeNode tn = new TreeNode();
tn.Text = oits.Title;
tn.Tag = oits.xmlUrl;
AddNodes(oits, tn);
nd.Nodes.Add(tn);
}
}
}
}


大致的运行效果如下:

 

现在,我说一下技术要点,不多,就一个,对,就是LinQ To XML。

这篇关于今天写了一个简单的新浪新闻RSS操作类库的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827897

相关文章

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

Java使用Curator进行ZooKeeper操作的详细教程

《Java使用Curator进行ZooKeeper操作的详细教程》ApacheCurator是一个基于ZooKeeper的Java客户端库,它极大地简化了使用ZooKeeper的开发工作,在分布式系统... 目录1、简述2、核心功能2.1 CuratorFramework2.2 Recipes3、示例实践3

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则

Python使用DrissionPage中ChromiumPage进行自动化网页操作

《Python使用DrissionPage中ChromiumPage进行自动化网页操作》DrissionPage作为一款轻量级且功能强大的浏览器自动化库,为开发者提供了丰富的功能支持,本文将使用Dri... 目录前言一、ChromiumPage基础操作1.初始化Drission 和 ChromiumPage

利用Go语言开发文件操作工具轻松处理所有文件

《利用Go语言开发文件操作工具轻松处理所有文件》在后端开发中,文件操作是一个非常常见但又容易出错的场景,本文小编要向大家介绍一个强大的Go语言文件操作工具库,它能帮你轻松处理各种文件操作场景... 目录为什么需要这个工具?核心功能详解1. 文件/目录存javascript在性检查2. 批量创建目录3. 文件

如何使用Python实现一个简单的window任务管理器

《如何使用Python实现一个简单的window任务管理器》这篇文章主要为大家详细介绍了如何使用Python实现一个简单的window任务管理器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起... 任务管理器效果图完整代码import tkinter as tkfrom tkinter i

Redis中管道操作pipeline的实现

《Redis中管道操作pipeline的实现》RedisPipeline是一种优化客户端与服务器通信的技术,通过批量发送和接收命令减少网络往返次数,提高命令执行效率,本文就来介绍一下Redis中管道操... 目录什么是pipeline场景一:我要向Redis新增大批量的数据分批处理事务( MULTI/EXE

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解