Quickstart 如何快速上手,一些示例代码

1

花 20 秒钟就可以了解如何在 Pyhton、NodeJS、PHP、Ruby、Curl 中对网页进行正文提取、标题提取、日期提取、下一页链接提取。

以下是一些调用 API 的示例代码,关于 URL2io RESTful API 的详细文档请看这

Curl

$ curl -G --data "token=your_token&fields=next" --data-urlencode "url=http://..." http://api.url2io.com/article

{"content": "...",
 "date": null,
 "next": null,
 "title": "...",
 "url": "http://..."}

Python

# 也可以使用 SDK
# https://github.com/url2io/url2io-python-client

>>> import requests
>>> from urllib import urlencode

>>> token = 'your token'          # 开发者 token, 注册后可得
>>> url = 'http://...'            # 要提取正文网页的网址
>>> fields = ','.join(['next',])  # 可选字段

>>> q = {'token': token, 'url': url, 'fields', fields}
>>> result = requests.get('http://api.url2io.com/article', params=q)
>>> result.json()

{u'content': u'...',
 u'date': None,
 u'next': None,
 u'title': u'...',
 u'url': u'http://...'}

NodeJS

var request = require('request');

request(
  { method: 'GET'
  , uri: 'http://api.url2io.com/article'
  , qs:
    { token: 'your_token'            // 开发者 token, 注册后可得
    , url: 'http://...'              // 要提取正文网页的网址
    , fields: ['next',].join(',')    // 可选字段
	}
  }
, function(error, res, body) {
	console.info(JSON.parse(body);
  }
)

{content: '...',
 date: null,
 next: null,
 title: '...',
 url: 'http://...'}

PHP

# url2io-phpsdk - https://github.com/ety001/url2io

<?php

use ETY001\URL2io\URL2io;             // 使用上述 SDK

$token = 'your_token';                // 开发者 token, 注册后可得
$url = 'http://';                     // 要提取正文网页的网址
$fields = join(',', array('next', )); // 可选字段

$url2io = new URL2io($token);
$result = $url2io->contentGet($url, $fields);

{"content": "...",
 "date": null,
 "next": null,
 "title": "...",
 "url": "http://..."}

Ruby

> require 'json'
> require 'open-uri'
> require 'cgi'

> token = 'your_token'           # 开发者 token, 注册后可得
> url = CGI.escape('http://...') # 要提取正文网页的网址
> fields = ['next',].join(',')   # 可选字段

> qs = "token=%s&url=%s&fields=%s" % [token, url, fields]
> JSON.parse(open('http://api.url2io.com/article'+'?'+qs).read)

=> {
  "content"=>"...",
  "data"=>nil,
  "next"=>nil,
  "title"=>"...",
  "url"=>"http://..."}
url2io-phpsdk 一个第三方PHP SDK 近期(10-02~10-27)的一些更新
>