Как известно веб-проекты с большой посещаемостью "живут" не на одном сервере, а на целых комплексах серверов, которые порой имеют весьма сложную структуру и в любом случае являются "штучными" решениями, "заточенными" под задачи конкретного проекта. Однако некоторые общие черты и заложенные идеи в большинстве случае можно проследить.
Автор этих строк принимал участие в разработке и развёртывании комплекса серверов для большого веб-проект (одним из разработчиков которого он является) и далее вниманию читателей предлагается конфигурация веб-сервера nginx с одного из серверов проекта, которую можно в ряде случаев рекомендовать другим проектам, которые "переросли" простые и популярные конфигурации.
Немного подробнее о комплексе серверов: Схема стоит из трёх серверов: front, back1 и back2. front имеет два сетевых интерфейса. Один смотрит в интернет, а второй - на локальную сеть, в которой находятс back1 и back2. Это иллюстрирует схема:
В реальности всё немного сложнее, как минимум есть ещё сервер базы данных и ещё кое-какие вспомогательные сервера, но рассмотрение этих серверов выходит за рамки данной статьи.
Основная задача фронтенда (сервер front) пересылать запросы на бэкенды (back1 и back2) разделяя нагрузку поровну, а в случае сбоя одного из бэкендов перенести всю нагрузку на оставшийся.
Фронтенд работает под управлением операционной системы FreeBSD 8.1 и на нём запущена тестовая версия nginx (в портах FreeBSD доступна как www/nginx-devel). Nginx собран со следующими опциями:
WITHOUT_DEBUG=true WITHOUT_DEBUGLOG=true WITHOUT_FILE_AIO=true WITHOUT_IPV6=true WITHOUT_GOOGLE_PERFTOOLS=true WITH_HTTP_MODULE=true WITHOUT_HTTP_ADDITION_MODULE=true WITH_HTTP_CACHE_MODULE=true WITHOUT_HTTP_DAV_MODULE=true WITHOUT_HTTP_FLV_MODULE=true WITHOUT_HTTP_GEOIP_MODULE=true WITHOUT_HTTP_GZIP_STATIC_MODULE=true WITHOUT_HTTP_IMAGE_FILTER_MODULE=true WITHOUT_HTTP_PERL_MODULE=true WITHOUT_HTTP_RANDOM_INDEX_MODULE=true WITHOUT_HTTP_REALIP_MODULE=true WITH_HTTP_REWRITE_MODULE=true WITHOUT_HTTP_SECURE_LINK_MODULE=true WITHOUT_HTTP_SSL_MODULE=true WITH_HTTP_STATUS_MODULE=true WITHOUT_HTTP_SUB_MODULE=true WITHOUT_HTTP_XSLT_MODULE=true WITHOUT_MAIL_MODULE=true WITHOUT_MAIL_IMAP_MODULE=true WITHOUT_MAIL_POP3_MODULE=true WITHOUT_MAIL_SMTP_MODULE=true WITHOUT_MAIL_SSL_MODULE=true WITH_WWW=true WITHOUT_CACHE_PURGE_MODULE=true WITHOUT_ECHO_MODULE=true WITHOUT_HEADERS_MORE_MODULE=true WITHOUT_HTTP_ACCEPT_LANGUAGE=true WITHOUT_HTTP_ACCESSKEY_MODULE=true WITHOUT_HTTP_AUTH_PAM_MODULE=true WITHOUT_HTTP_AUTH_REQ_MODULE=true WITHOUT_HTTP_EVAL_MODULE=true WITHOUT_HTTP_FANCYINDEX_MODULE=true WITHOUT_HTTP_GUNZIP_FILTER=true WITHOUT_HTTP_MOGILEFS_MODULE=true WITHOUT_HTTP_MP4_H264_MODULE=true WITHOUT_HTTP_NOTICE_MODULE=true WITHOUT_HTTP_PUSH_MODULE=true WITHOUT_HTTP_REDIS_MODULE=true WITHOUT_HTTP_RESPONSE_MODULE=true WITHOUT_HTTP_UPLOAD_MODULE=true WITHOUT_HTTP_UPLOAD_PROGRESS=true WITHOUT_HTTP_UPSTREAM_FAIR=true WITHOUT_HTTP_UPSTREAM_HASH=true WITHOUT_HTTP_UPSTREAM_KEEPALIVE=true WITHOUT_HTTP_ZIP_MODULE=true WITHOUT_MEMC_MODULE=true WITHOUT_SLOWFS_CACHE_MODULE=true WITHOUT_SUPERVISORD_MODULE=true WITHOUT_UDPLOG_MODULE=true
Приведём сразу готовую конфигурацию nginx (файл /usr/local/etc/nginx/nginx.conf) опустив специфичные для проекта моменты:
# Количество форков основого процесса. Рекомендуется по одному форку на каждое процессорное ядрое worker_processes 4; # Для обработки очереди используем механизм kqueue # На каждый форк устанавливаем ограничение в 1024 tcp-соединения events { worker_connections 1024; use kqueue; } http { # Не будем включать в http-заголовки информацию о сервере. Это немного повысит производительность. server_tokens off; # Описание MIME-типов include mime.types; # Неизвестные документы получат этот MIME-тип default_type application/octet-stream; # Без нужды в логи мусорить не будем access_log /dev/null; # Тонкие настройки обработки запросов sendfile on; aio off; tcp_nodelay on; tcp_nopush on; # Именно столько и не больше будут жить устойчивые соединения # Слишком большое значение приведёт к большому количеству полуоткрытых сокетов # Слишком маленькое - не позволит клиентам насладиться всеми прелестями HTTP/1.1 keepalive_timeout 3; # Настройки проксирования client_body_buffer_size 128K; client_header_buffer_size 128K; client_max_body_size 1M; large_client_header_buffers 1 1k; proxy_temp_path /usr/home/nginx/proxy_temp; proxy_cache_path /usr/home/nginx/proxy_cache levels=1:2 keys_zone=one:30m max_size=1g; client_body_temp_path /usr/home/nginx/client_body_temp; fastcgi_temp_path /usr/home/nginx/fastcgi_temp; proxy_pass_header Cookie; proxy_pass_header Set-Cookie; proxy_cache_key $scheme$proxy_host$request_uri$http_cookie$http_set-cookie; # Сжатие позволит отдавать контент клиентам быстрее gzip on; gzip_types application/x-javascript application/javascript text/css text/plain application/xml application/rss+xml text/vnd.wap.wml; gzip_vary on; gzip_comp_level 9; # Описание апстрима - место, куда мы будем пересылать http-запросы # Количество бэков может быть любым # Параметр weight описывает приоритет бэка # Параметр max_fails описывает количество сбоев подряд прежде чем бэк считаемся мёртвым # Параметр fail_timeout указывает время, через которое можно попробовать снова использовать мёртвые бэки upstream project_backends { server back1 weight=10 max_fails=3 fail_timeout=30s; server back2 weight=10 max_fails=3 fail_timeout=30s; } # Собственно описание сервера server { # Слушаем 80-й порт listen *:80; # Имя севера server_name front; # При пересылке запросов не будем менять значение заголовка Host server_name_in_redirect off; # Имя файла журнала access_log /usr/home/logs/nginx-access.log; # Все запросы location / { # Пересылаем запросы на бэкенды proxy_pass http://project_backends; proxy_redirect off; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; client_max_body_size 10m; client_body_buffer_size 128k; proxy_connect_timeout 30; proxy_send_timeout 90; proxy_read_timeout 90; proxy_buffer_size 8k; proxy_buffers 4 32k; proxy_busy_buffers_size 64k; proxy_temp_file_write_size 10m; } # Запросы к статике location ~* ^.+.(jpg|jpeg|gif|css|png|js|ico)$ { # Принудительно указываем заголовок Expire expires 30d; # Запросы по прежнему пересылаем на бэкенды proxy_pass http://project_backends; # Однако здесь мы их кэшируем на один час # Это позволяет немного разгрузить бэкенды proxy_cache_valid 60m; proxy_redirect off; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_cache_key $scheme$proxy_host$request_uri$host; proxy_cache one; } } }
Основная изюминка этой конфигурации - кэширование статического контента на фронтенде, что позволяет с одной стороны ускорить обработку запросов к статическому контенту, а с другой - немного разгрузить бэкенды. Статистика за один час работы всего комплекса выглядит так:
Сервер: | front | back1 | back2 |
---|---|---|---|
Количестно HTTP-запросов: | 1010426 | 149716 | 149566 |
Видно что количество запросов, пересылаемых бэкендам сократилось на 70%! Не менее интересны графики трафика на сетевых интерфейсах. Трафик на внешнем интерфейсе фронтенда:
В то время как трафик на втором интерфейсе фронтенда:
То есть отдавая клиентам поток до девяти мегабайт в секунду фронтенд сам создаёт поток трафика с бэкендов не более четырёх мегабайт в секунду. Можно говорить о том что бэкенды избавлены от солидной части работы по обработке статического контента и могут спокойно заниматься обработкой динамического контента:)
На этом всё. Приятной работы!
Anonymous 2010-11-29 21:49:09 (#)