跳到主要内容

Ruby 使用 XML

上节我们介绍了 JSON,本章节主要介绍一下 Ruby 中如何使用 XML。

1. 什么是 XML

可扩展标记语言(英语:Extensible Markup Language,简称为 XML)是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。

XML 跟 HTML 语言很类似,但是不同的是,XML 是为了传输数据而存在的而不是显示数据,它具有一定的自我描述性。

常见的 XML 例子:

<priceList>
<goods good\_id="1">
<name>小米</name>
<price>1999</price>
</goods>
<goods good\_id="2">
<name>华为</name>
<price>2999</price>
</goods>
<goods good\_id="3">
<name>苹果</name>
<price>5999</price>
</goods>
</priceList>


2. 使用 Ruby 来操作 XML

2.1 使用Ruby来解析XML

我们将上面的例子放到一个price_list.xml文件中去。

解析文件要使用到 XPath。XPath 使用路径表达式来选择 XML 文档中的节点,下面是一些 XPath 的基本规则:

表达式描述
nodename选择所有名称为“nodename“的节点
/从根节点选择
//从当前节点中选择匹配选择的节点,无论它们在何处
.选择当前节点
选择当前节点的父节点
@选择属性

下面给出了一些例子来理解XPath

表达式时机简介(调用的时机)
bookstore选择所有名称为“bookstore”的节点
/bookstore选择根元素bookstore。注意:如果路径以斜杠(/)开头,则始终表示元素的绝对路径
bookstore/book选择所有属于bookstore子级的book元素
//book选择所有书籍元素,无论它们在文档中的位置如何
bookstore//book选择作为bookstore元素后代的所有book元素,无论它们在bookstore元素下的位置如何
//@lang选择所有名为lang的属性

下面是XPath谓词Predicates)的使用方法:

表达式时机简介(调用的时机)
/bookstore/book[1]选择第一个book元素,它是bookstore元素的子元素。
/bookstore/book[last()]选择作为bookstore元素的子元素的最后一个book元素
/bookstore/book[last()-1]选择倒数第二个book元素,它是bookstore元素的子元素
/bookstore/book[position()<3]选择作为bookstore元素的子元素的前两个book元素
//title[@lang]选择所有具有名为lang的属性的title元素
//title[@lang=‘en’]选择所有具有“lang”属性且值为“en”的title元素
/bookstore/book[price>35.00]选择bookstore元素中所有price元素大于35.00的book元素
/bookstore/book[price>35.00]/title选择bookstore元素的book元素的所有title元素,它们的price元素的价格大于35.00。

现在让我们打印出所有手机品牌的价格信息,在和 price_list.xml 同一目录下创建脚本,这里我们会使用到rexml/document库。

require 'rexml/document'
include REXML

xmlfile = File.new("price\_list.xml")
xmldoc = Document.new(xmlfile)


XPath.each(xmldoc, '//priceList/goods').each do |good|
p good.elements["name"].text
p good.elements["price"].text
end

# ---- 输出结果 ---
"小米"
"1999"
"华为"
"2999"
"苹果"
"5999"

解释:

我们通过XPath.each获取所有goods元素,然后对这个结果进行迭代,迭代后每一个goods元素中的elements方法可以获取到goods的每个子节点。使用[key]获取每个节点,输出它然后再使用text方法输出其中的字符串。

2.2 使用 Ruby 生成 XML 文件

生成XML我们要使用builder库。

require 'builder'

def product_xml
xml = Builder::XmlMarkup.new( :indent => 2 )
xml.instruct! :xml, :encoding => "ASCII"
xml.product do |p|
p.name "Test XML"
end
end

puts product_xml

# ---- 输出结果 ---
<?xml version="1.0" encoding="ASCII"?>
<product>
<name>Test XML</name>
</product>

之后如果需要的话将这个 XML 写入到文件中即可。

3. 小结

本章节我们了解了什么是 XML,XPath 的基本规则有哪些,在 Ruby 中使用 XPath 解析到元素。使用builder创建一个 XML 文件。