Парсинг на Ruby часто виконується з використанням gem’ів для обробки HTML, XML або JSON. Ось приклади використання деяких популярних гемів для парсингу в Ruby:
Nokogiri (HTML і XML):
Nokogiri - це потужна бібліотека для парсингу HTML і XML в Ruby. Вона надає простий і зручний інтерфейс для навігації по документах.
require 'nokogiri'
require 'open-uri'
# Завантаження HTML сторінки
doc = Nokogiri::HTML(URI.open('http://example.com'))
# Отримання всіх посилань на сторінці
links = doc.css('a')
links.each { |link| puts link['href'] }
JSON (робота з JSON):
Якщо ви працюєте з даними у форматі JSON, Ruby постачається з вбудованою бібліотекою json
.
require 'json'
json_data = '{"name": "John", "age": 30, "city": "New York"}'
parsed_data = JSON.parse(json_data)
puts parsed_data['name']
puts parsed_data['age']
puts parsed_data['city']
CSV (робота з CSV файлами):
Для роботи з CSV файлами в Ruby також є вбудована бібліотека csv
.
require 'csv'
CSV.foreach('example.csv') do |row|
puts row.join(', ')
end
HTTParty (робота з веб-запитами):
HTTParty
- це бібліотека, яка полегшує виконання HTTP-запитів та обробку відповідей.
require 'httparty'
response = HTTParty.get('https://jsonplaceholder.typicode.com/todos/1')
parsed_response = JSON.parse(response.body)
puts parsed_response['title']
Ці приклади надають базове уявлення про те, як можна використовувати різні бібліотеки для парсингу даних в Ruby. Вибір gem`у залежить від формату даних, з якими ви працюєте, та вимог вашого проекту.