import pandas as pd
import geopandas as gpd
from shapely.geometry import Point
from datetime import datetime
from pyinaturalist import get_observations
import ipyplotMis fotos del año 2008
En el año 2008 realicé junto a mi Ada varias salidas de campo para un proyecto sobre la relación entre la mariposa Kricogonia lyside y el Guayacán (Guaiacum officinale). Este trabajo nos llevó por diferentes rutas de la costa de Venezuela, especialmente en Falcón y Anzoátegui. Fueron paseos muy interesantes de los cuales tomamos muchas muestras de mariposas, datos de presencia de ambas especies, bitácoras de viaje y puntos de GPS.
Para poner estas observaciones de 2008 en contexto temporal de mis contribuciones a iNat, pueden revisar este gráfico
Después de terminar de actualizar mis observaciones de 2010, he decidido repetir el proceso para el año 2008. Este documento me permite visualizar las fotos que ya están en iNaturalist y así evitar subir fotos por duplicado. Lamentablemente solo tomamos unas pocas fotos en algunos de los viajes de este año, y entre ellas no he encontrado muchas fotos para contribuir en iNaturalist.
Cargar módulos en Python
Importamos los módulos necesarios:
Y declaramos una función útil para leer los datos temporales de la respuesta del API de iNat:
def as_date(x):
if type(x) == str:
y = datetime.strptime(x, "%Y-%m-%d").date()
else:
y = datetime.date(x)
return(y)Descargar datos
Los datos espaciales de los estados de Venezuela están disponibles a través de esta página del Humanitarian Data Exchange: https://data.humdata.org/dataset/cod-ab-ven Usamos read_file del modulo geopandas para abrir esta capa desde el url de descarga.
zipurl = 'https://data.humdata.org/dataset/5b141d29-534f-4f01-a0bc-41e2f375d925/resource/b6cf4bf5-418a-49ad-80ec-b84d0e0e0d41/download/ven_adm_ine_20210223_shp.zip'
vzla_estados=gpd.read_file(zipurl,
layer='ven_admbnda_adm1_ine_20210223',
columns=['ADM1_ES','geometry'])Usamos get_observations con un intervalo de fechas que incluye todo el año 2010:
observations = get_observations(user_id='NeoMapas',
d1="2008-01-01",
d2="2008-12-31",
per_page=1000)Este número aumenta a medida que cargamos observaciones en iNat:
len(observations['results'])73
Usamos este loop para guardar la información básica de cada observación:
records=list()
for obs in observations['results']:
record = {
'uri':obs['uri'],
'species guess': obs['species_guess'],
'location': obs['place_guess'],
'longitude': obs['location'][1],
'latitude': obs['location'][0],
'Fecha_obs': as_date(obs['observed_on']),
'Fecha_reg': as_date(obs['created_at'])
}
if len(obs['observation_photos'])>0:
record['url'] = obs['observation_photos'][0]['photo']['url'].replace("square","medium")
record['attribution'] = obs['observation_photos'][0]['photo']['attribution']
records.append(record)Y las transformamos en un marco de datos con información espacial para usar con geopandas:
gs = [Point(float(obs['longitude']), float(obs['latitude'])) for obs in records]
inat_obs=gpd.GeoDataFrame(records, geometry=gs, crs="EPSG:4326")Resumen de las observaciones por estado
Primero combinamos la información de iNat con los estados de Venezuela. Usamos la función sjoin_nearest porque algunas observaciones provienen de la costa y las coordenadas de especies amenazadas están protegidas.
crs_lacanoa="EPSG:24719"inat_obs_estados = gpd.sjoin_nearest(
inat_obs.to_crs(crs_lacanoa),
vzla_estados.to_crs(crs_lacanoa),
distance_col="distances",
how="left",
max_distance=50000,
lsuffix='in',
rsuffix='vzla')inat_obs_estados.fillna({'ADM1_ES':'No info'},inplace=True)Agrupamos las observaciones por la localidad y obtenemos una tabla resumen de las observaciones del año:
aggfuns = {
'Fecha_obs': ["min", "max"],
'species guess': ['count',pd.Series.nunique],
}
inat_obs_estados.groupby('ADM1_ES').agg(aggfuns).sort_values(('Fecha_obs','min'))| Fecha_obs | species guess | |||
|---|---|---|---|---|
| min | max | count | nunique | |
| ADM1_ES | ||||
| Anzoátegui | 2008-01-12 | 2008-07-05 | 9 | 9 |
| Miranda | 2008-01-12 | 2008-11-24 | 15 | 15 |
| Falcón | 2008-01-26 | 2008-07-18 | 32 | 25 |
| No info | 2008-06-10 | 2008-06-10 | 6 | 6 |
| Zulia | 2008-07-20 | 2008-07-20 | 2 | 2 |
| La Guaira | 2008-08-30 | 2008-08-30 | 4 | 3 |
| Aragua | 2008-09-25 | 2008-09-28 | 4 | 4 |
Filtrar por fecha
Con estas líneas de código podemos filtrar por fecha de observación:
inat_obs['mes'] = [fobs.month for fobs in inat_obs['Fecha_obs']]En junio estuve participando en un curso en la Estación Biológica La Selva, en Costa Rica:
ss = inat_obs['mes'] == 6
images = inat_obs.loc[ss,'url']
labels = inat_obs.loc[ss,'species guess']
ipyplot.plot_images(list(images), list(labels), max_images=60,)Progreso
Aquí se puede ver el progreso que he hecho en cargar las fotos del año 2008, creo que estas son todas las que tengo respaldadas:
aggfuns = {
'Fecha_obs': ["min", "max"],
'location': ['count',pd.Series.nunique],
'species guess': [pd.Series.nunique],
}
inat_obs.groupby('Fecha_reg').agg(aggfuns)| Fecha_obs | location | species guess | |||
|---|---|---|---|---|---|
| min | max | count | nunique | nunique | |
| Fecha_reg | |||||
| 2020-07-14 | 2008-01-27 | 2008-11-23 | 2 | 2 | 2 |
| 2023-11-19 | 2008-11-23 | 2008-11-23 | 1 | 1 | 1 |
| 2025-07-26 | 2008-01-27 | 2008-01-31 | 6 | 2 | 6 |
| 2025-07-27 | 2008-01-12 | 2008-09-28 | 25 | 10 | 25 |
| 2025-07-28 | 2008-11-24 | 2008-11-24 | 4 | 1 | 4 |
| 2025-07-30 | 2008-01-26 | 2008-07-20 | 16 | 5 | 13 |
| 2025-08-03 | 2008-07-05 | 2008-07-18 | 7 | 6 | 6 |
| 2025-08-06 | 2008-08-30 | 2008-08-30 | 4 | 1 | 3 |
| 2025-08-09 | 2008-03-31 | 2008-09-25 | 8 | 6 | 7 |
Todas las observaciones
Y cierro aquí con todas las imágenes de las observaciones de este año:
images = inat_obs.sort_values('Fecha_obs')['url']
labels = inat_obs.sort_values('Fecha_obs')['species guess']
ipyplot.plot_images(list(images), list(labels), max_images=200,)