Por qué son importantes las listas de proxy en tiempo real
Imagina que estás en Bondi Beach, listo para coger la ola perfecta, solo que cada vez que remas, la rompiente ya está rota. Así es como se siente navegar por internet con proxies obsoletos. Las listas de proxys en tiempo real son como un informe de surf en vivo: te ofrecen proxies actualizados y funcionales a medida que aparecen, no fallos que te dejarán sin aliento.
Al rastrear sitios, automatizar tareas o evitar bloqueos geográficos, los proxies obsoletos no te ayudan a nada. Las listas dinámicas que se actualizan en tiempo real implican menos fallos, menos tiempo dedicado a la resolución de problemas y más tiempo para obtener los datos que necesitas.
Criterios clave para evaluar listas de proxy
Vayamos al grano: esto es lo que diferencia una buena lista de proxy de una mala:
Criterio | Por qué es importante | Cómo comprobarlo |
---|---|---|
Frecuencia de actualización | Constantemente aparecen nuevos proxies | Comprobar marcas de tiempo y documentación de la API |
Estado latente | Más bajo = raspado o navegación más rápido | Prueba con ping o tu scraper |
Tipo (HTTP/SOCKS4/SOCKS5) | Algunos sitios bloquean ciertos protocolos | La lista debe especificar los tipos de proxy |
Nivel de anonimato | Transparente, anónimo, élite | La lista debe indicar o probar el anonimato |
Tiempo de actividad/tasa de vida | Los proxies rotos son un peso muerto | Filtrar por última vez verificada/en funcionamiento |
Diversidad geográfica | Más ubicaciones = más opciones | Consultar los campos de país/ciudad |
Método de acceso | Web, API, CSV o texto sin formato | Debe adaptarse a su flujo de trabajo |
Listas de los mejores servidores proxy en tiempo real (con detalles prácticos)
1. Raspado de proxy
Hora del cuento: Una vez tuve un amigo, Jacko, que creía haber encontrado oro con una lista estática de proxy, hasta que se agotó más rápido que un billabong en enero. Y ahí está ProxyScrape: siempre nuevo, siempre gratis.
Características:
– Se actualiza cada minuto
– Proxies HTTP, SOCKS4, SOCKS5
– Descargar como TXT, CSV o mediante API
Ejemplo de uso de la API:
curl 'https://api.proxyscrape.com/v2/?request=getproxies&protocol=http&timeout=10000&country=all&ssl=all&anonymity=all'
Ventajas:
– No es necesario registrarse
– Fácil de filtrar por protocolo y país
Contras:
– Las listas gratuitas pueden verse afectadas y los servidores proxy se queman rápidamente
2. Espías.uno
Analogía australiana: Navegar por Spys.one es un poco como leer un mapa de mareas: parece complicado, pero una vez que conoces los trucos, todo va sobre ruedas.
Características:
– Actualizaciones de proxy en tiempo real (se actualizan cada minuto)
– HTTP, HTTPS, SOCKS4, SOCKS5
– Filtros de país, puerto y tiempo de actividad
Cómo extraer datos de proxies:
import requests
from bs4 import BeautifulSoup
url = "http://spys.one/en/http-proxy-list/"
headers = {'User-Agent': 'Mozilla/5.0'}
r = requests.get(url, headers=headers)
soup = BeautifulSoup(r.text, 'html.parser')
# Extract proxies from the table to your heart's content
Ventajas:
– Gran volumen, estadísticas detalladas
– Se muestra el tiempo de actividad y la latencia
Contras:
– No hay API oficial (necesitarás extraer HTML)
– La interfaz es un poco de la vieja escuela.
3. Lista de Proxy Gratis.cc
Características:
– Actualizado cada 10 segundos
– HTTP, HTTPS, SOCKS4, SOCKS5
– Filtros de país, puerto y anonimato
Descarga directa:
– Formatos CSV y TXT disponibles
Ejemplo de uso rápido:
wget https://freeproxylist.cc/proxylist.txt -O proxies.txt
Ventajas:
– Actualizaciones rápidas
– Interfaz sencilla y limpia
Contras:
– No hay API para acceso programático
4. Descargar lista de proxy
Un poco como el mercado de pescado local: la selección cambia rápidamente y debes ser rápido para conseguir la pesca más fresca.
Características:
– Listas separadas para HTTP, HTTPS, SOCKS4, SOCKS5
– Actualizado cada 5 minutos
– Descargar como TXT, CSV o JSON
Ejemplo de API:
curl 'https://www.proxy-list.download/api/v1/get?type=http'
Ventajas:
– Múltiples formatos, API sencilla
– Ordenado por protocolo
Contras:
– Los proxies gratuitos se agotan rápidamente
5. OpenProxy.space
Características:
– Actualizaciones en tiempo real, verifica los servidores proxy cada minuto
– HTTP, HTTPS, SOCKS4, SOCKS5
– Filtros de país, puerto y estado
Fragmento de API:
curl 'https://openproxy.space/list/http'
Ventajas:
– Alta tasa de supervivencia
– Múltiples métodos de acceso
Contras:
– Algunos proxies están marcados como potencialmente riesgosos
Tabla comparativa: Listas de los mejores servidores proxy en tiempo real
Nombre | Protocolos | Frecuencia de actualización | Acceso a la API | Formatos | Filtros | ¿Gratis? |
---|---|---|---|---|---|---|
Raspado de proxy | HTTP, SOCKS4/5 | 1 minuto | Sí | TXT, CSV | País, Protocolo | Sí |
Espías.uno | HTTP, SOCKS | 1 minuto | No | HTML | País, Tiempo de actividad | Sí |
Lista de Proxy Gratis.cc | HTTP, HTTPS… | 10 segundos | No | TXT, CSV | País, Anonimato | Sí |
Descargar lista de proxy | HTTP, SOCKS | 5 minutos | Sí | TXT, CSV | Protocolo | Sí |
OpenProxy.space | HTTP, SOCKS | 1 minuto | Sí | TXT | País, Estado | Sí |
Uso de listas de proxy en tiempo real: pasos prácticos
Paso 1: Obtenga una lista de servidores proxy nueva
Digamos que quieres una lista de servidores proxy HTTP para un raspador web:
import requests
url = "https://api.proxyscrape.com/v2/?request=getproxies&protocol=http&timeout=5000"
proxies = requests.get(url).text.splitlines()
print(proxies[:5]) # Show first 5 proxies
Paso 2: Prueba la validez del proxy
No tiene sentido remar en un día llano. Siempre prueba tus proxies antes de confiar en ellos.
import requests
def test_proxy(proxy):
try:
r = requests.get('https://httpbin.org/ip', proxies={'http': f'http://{proxy}'}, timeout=5)
return r.status_code == 200
except:
return False
working_proxies = [p for p in proxies if test_proxy(p)]
print(f"{len(working_proxies)} working proxies found.")
Paso 3: Rotar servidores proxy automáticamente
Para evitar bloqueos, rote los proxies en su código:
import random
def get_random_proxy(proxies):
return random.choice(proxies)
for url in urls_to_scrape:
proxy = get_random_proxy(working_proxies)
r = requests.get(url, proxies={'http': f'http://{proxy}'})
# ... process response ...
Consejos de seguridad y uso
- Verifique siempre la legalidad del proxy en su país.
- Nunca envíe datos personales a través de proxies gratuitos.
- Supervise el rendimiento del proxy: elimine los proxies inactivos rápidamente.
- Utilice agentes de usuario rotativos junto con servidores proxy para mantener el sigilo.
Referencia rápida: Protocolos proxy
Protocolo | Caso de uso | Formato de ejemplo |
---|---|---|
HTTP | Web scraping, navegación | 123.45.67.89:8080 |
HTTPS | Web scraping seguro | 123.45.67.89:443 |
SOCKS4 | Tráfico general, no SSL | socks4://123.45.67.89:1080 |
SOCKS5 | Todo el tráfico admite autenticación | socks5://user:[email protected]:1080 |
Cuando navegas por las olas de internet, las listas de proxy en tiempo real son tu tabla de confianza. Mantenlas actualizadas, pruébalas con frecuencia y nunca confíes en un proxy desprevenido para que te ayude a superar la próxima gran ola.
Comentarios (0)
Aún no hay comentarios aquí, ¡puedes ser el primero!