自定义Linker与SO加固#

0x01 前言#

在研究360加固方案时，我发现其采用了一种独特的保护机制：在主SO文件内部嵌套了另一个SO文件，相当于为主SO添加了一层保护壳。这种技术实现引起了我的兴趣，经过深入研究，整理出本文，分享自定义Linker的实现原理及SO加固技术

0x02 Linker源码分析#

PS：这部分有点长，如果你只想看怎么实现的，可以直接跳到总结#

核心代码解析（只贴关键部分，不然太长了）#

do_dlopen - 一切的起点#

1
soinfo* si = find_library(name);    // 查找并加载SO到内存
2
if (si != NULL) {
3
    si->CallConstructors();          // 调用SO的初始化函数
4
}

看起来很简单对吧，让我们深入看看这两个函数都干了啥

find_library - 负责找SO的函数#

1
static soinfo* find_library(const char* name) {
2
  soinfo* si = find_library_internal(name);  // 寻找相应的SO信息
3
  if (si != NULL) {
4
    si->ref_count++;   // 这个计数很重要，用来判断SO是否已经加载过
5
  }
6
  return si;
7
}

CallConstructors - 调用构造函数#

1
// 直接看重点
2
if (dynamic != NULL) {
3
    for (Elf32_Dyn* d = dynamic; d->d_tag != DT_NULL; ++d) {
4
      if (d->d_tag == DT_NEEDED) {    // 先调用依赖库的构造函数
5
        const char* library_name = strtab + d->d_un.d_val;
6
        TRACE("\"%s\": calling constructors in DT_NEEDED \"%s\"", name, library_name);
7
        find_loaded_library(library_name)->CallConstructors();
8
      }
9
    }
10
}
11
// DT_INIT要在DT_INIT_ARRAY之前调用
12
TRACE("\"%s\": calling constructors", name);
13
CallFunction("DT_INIT", init_func);           // SO文件加壳的脱壳点！划重点！
14
CallArray("DT_INIT_ARRAY", init_array, init_array_count, false);

这里有个有趣的地方：DT_INIT和DT_INIT_ARRAY是很多加固方案的脱壳点，因为这是SO被加载后最早执行的地方之一

find_library_internal - 真正干活的函数#

1
static soinfo* find_library_internal(const char* name) {
2
  if (name == NULL) {
3
    return somain;
4
  }
5

6
  soinfo* si = find_loaded_library(name);
7
  if (si != NULL) {
8
    if (si->flags & FLAG_LINKED) {
9
      return si;    // 已经加载过了，直接返回
10
    }
11
    DL_ERR("OOPS: recursive link to \"%s\"", si->name);
12
    return NULL;
13
  }
14

15
  TRACE("[ '%s' has not been loaded yet.  Locating...]", name);
16
  si = load_library(name);    // 真正加载SO文件的地方
17
  if (si == NULL) {
18
    return NULL;
19
  }
20

21
  TRACE("[ init_library base=0x%08x sz=0x%08x name='%s' ]",
22
        si->base, si->size, si->name);
23

24
  if (!soinfo_link_image(si)) {    // 执行重定位（会用mmap，所以在/proc/pid/maps能看到）
25
    munmap(reinterpret_cast<void*>(si->base), si->size);
26
    soinfo_free(si);
27
    return NULL;
28
  }
29

30
  return si;
31
}

关于重定位：想象一下，你的SO文件里调用了printf函数，但编译的时候并不知道printf在内存的哪个位置，所以先用个占位符（比如call 0x1234）。重定位就是把这个占位符改成真实的地址

基本流程梳理：

find_loaded_library()：先看看是不是已经加载过了
load_library()：没加载过，那就加载
soinfo_link_image()：处理各种动态信息，执行重定位

load_library - 真正的加载器#

1
static soinfo* load_library(const char* name) {
2
    // 打开文件
3
    int fd = open_library(name);
4
    if (fd == -1) {
5
        DL_ERR("library \"%s\" not found", name);
6
        return NULL;
7
    }
8

9
    // 读取ELF头并加载段
10
    ElfReader elf_reader(name, fd);
11
    if (!elf_reader.Load()) {    // 注意：这里只读Program段！
12
        return NULL;
13
    }
14

15
    const char* bname = strrchr(name, '/');
16
    // 为SO分配soinfo结构
17
    soinfo* si = soinfo_alloc(bname ? bname + 1 : name);
18
    if (si == NULL) {
19
        return NULL;
20
    }
21

22
    // 初始化soinfo对象
23
    si->base = elf_reader.load_start();
24
    si->size = elf_reader.load_size();
25
    si->load_bias = elf_reader.load_bias();
26
    si->flags = 0;
27
    si->entry = 0;
28
    si->dynamic = NULL;
29
    si->phnum = elf_reader.phdr_count();
30
    si->phdr = elf_reader.loaded_phdr();
31
    return si;
32
}

ElfReader::Load()#

1
bool ElfReader::Load() {
2
  return ReadElfHeader() &&          // 读ELF头
3
         VerifyElfHeader() &&        // 校验ELF头
4
         ReadProgramHeader() &&      // 读程序头
5
         ReserveAddressSpace() &&    // 分配内存空间
6
         LoadSegments() &&           // 加载段（脱壳的好地方）
7
         FindPhdr();                 // 设置加载地址
8
}

发现：Android只读Program Header，而IDA依赖Section Header！这就是为什么很多加固会”抹头”——把Section Header搞坏，IDA就懵了，但Android照样能跑

soinfo_link_image - 链接的核心#

在si = load_library(name)拿到SO信息后，就要开始一系列复杂操作了：

1. 定位动态节#

1
phdr_table_get_dynamic_section(const Elf32_Phdr* phdr_table,
2
                               int               phdr_count,
3
                               Elf32_Addr        load_bias,
4
                               Elf32_Dyn**       dynamic,
5
                               size_t*           dynamic_count,
6
                               Elf32_Word*       dynamic_flags)
7
{
8
    const Elf32_Phdr* phdr = phdr_table;
9
    const Elf32_Phdr* phdr_limit = phdr + phdr_count;
10

11
    for (phdr = phdr_table; phdr < phdr_limit; phdr++) {
12
        if (phdr->p_type != PT_DYNAMIC) {    // 找DYNAMIC段
13
            continue;
14
        }
15

16
        *dynamic = reinterpret_cast<Elf32_Dyn*>(load_bias + phdr->p_vaddr);
17
        if (dynamic_count) {
18
            *dynamic_count = (unsigned)(phdr->p_memsz / 8);
19
        }
20
        if (dynamic_flags) {
21
            *dynamic_flags = phdr->p_flags;
22
        }
23
        return;    // 注意：找到第一个就返回了！
24
    }
25
    *dynamic = NULL;
26
    if (dynamic_count) {
27
        *dynamic_count = 0;
28
    }
29
}

又一个有趣的发现：源码只处理第一个PT_DYNAMIC段！所以你可以加多个动态节来迷惑IDA，因为IDA会全部解析，而Android只看第一个。这算是个小技巧吧~

2. 解析动态节#

这部分代码太长了，主要就是初始化各种表：符号表、字符串表、重定位表等等。

3. 加载依赖库#

1
// 加载依赖库 (DT_NEEDED)
2
for (Elf32_Dyn* d = si->dynamic; d->d_tag != DT_NULL; ++d) {
3
    if (d->d_tag == DT_NEEDED) {
4
        const char* library_name = si->strtab + d->d_un.d_val;
5
        DEBUG("%s needs %s", si->name, library_name);
6
        soinfo* lsi = find_library(library_name);    // 递归加载依赖
7
        if (lsi == NULL) {
8
            strlcpy(tmp_err_buf, linker_get_error_buffer(), sizeof(tmp_err_buf));
9
            DL_ERR("could not load library \"%s\" needed by \"%s\"; caused by %s",
10
                   library_name, si->name, tmp_err_buf);
11
            return false;
12
        }
13
        *pneeded++ = lsi;
14
    }
15
}

4. 重定位操作#

1
if (si->has_text_relocations) {
2
    // 让代码段可写，这样才能修改
3
    DL_WARN("%s has text relocations. This is wasting memory and is "
4
            "a security risk. Please fix.", si->name);
5
    if (phdr_table_unprotect_segments(si->phdr, si->phnum, si->load_bias) < 0) {
6
        DL_ERR("can't unprotect loadable segments for \"%s\": %s",
7
               si->name, strerror(errno));
8
        return false;
9
    }
10
}
11

12
if (si->plt_rel != NULL) {
13
    DEBUG("[ relocating %s plt ]", si->name );
14
    if (soinfo_relocate(si, si->plt_rel, si->plt_rel_count, needed)) {
15
        return false;
16
    }
17
}
18
if (si->rel != NULL) {
19
    DEBUG("[ relocating %s ]", si->name );
20
    if (soinfo_relocate(si, si->rel, si->rel_count, needed)) {
21
        return false;
22
    }
23
}

小结一下#

说白了，Linker就是个搬运工，把磁盘上的SO文件按照一定的规则搬到内存里，让我们的程序能够调用。主要干这么几件事：

1. 加载ELF文件#

用mmap把SO文件映射到内存（就像把文件”贴”到内存里）
解析各种头部信息
给.bss、.data这些段分配空间

2. 处理依赖关系#

看看这个SO依赖哪些其他的SO
把依赖的SO也加载进来（递归的过程）
建立依赖关系图，避免重复加载

3. 符号解析和重定位#

找到导出的函数和变量
修正函数调用地址
处理各种符号冲突

4. 执行初始化#

按正确的顺序调用各个构造函数

0x03 自定义Linker实现#

基于对Android Linker的理解，实现自定义Linker无需像AOSP源码那样考虑所有情况。我们可以专注于核心功能，实现一个精简版本

详细实现可参考：自實現Linker加載so

我实现的自定义Linker项目：soLoader

架构设计#

组件关系图：

Relationship

核心组件职责：

组件名称	主要功能	关键操作
`ElfLoader`	系统协调器和公共API	`LoadLibrary()`, `GetSymbol()`, `CallConstructors()`
`ElfReader`	ELF文件解析与验证	读取头部、提取程序头、验证格式
`MemoryManager`	内存分配与保护	`mmap()`操作、段加载、权限设置
`SoinfoManager`	共享对象元数据管理	`soinfo`结构创建、依赖跟踪
`Relocator`	符号解析与重定位	处理重定位、解析符号、处理PLT/GOT
`Utils`	系统工具与内省	系统调用、ELF结构辅助函数

具体实现原理请参考项目源码

0x04 SO加固实现#

加固方案设计#

以360加固为例，其核心思想是将主SO加密后嵌入壳SO中。壳SO作为loader被原生Linker加载后，负责解密、映射、链接、重定位主SO，最终调用主SO的函数来释放DEX

我们自己在设计的时候可以直接照搬这种模式，但是把两个so合并的操作有些麻烦，而且主SO本身就是被加密的，我个人觉得放在哪里都无所谓，你要想解密都得去分析壳SO，所以这里我实现了一个简化的版本，把主SO加密之后藏在了图片的后面，这样看上去它就是一张普通的图片

为简化实现，本方案采用以下设计：

不将两个SO合并，而是将加密的主SO隐藏在APK资源中
选择res/mipmap/ic_launcher.webp（应用图标）作为载体
使用RC4算法加密主SO，并添加魔数标识便于定位

加密实现#

加密脚本的核心功能：

1
#!/usr/bin/env python3
2
"""
3
python prepare_hidden_so.py <so_file> <webp_image> <output_image> <key>
4
"""
5

6
import sys
7
import os
8
import struct
9

10
MAGIC_HEADER = b"Yuuki"
11

12
def rc4_init(key):
13
    """初始化RC4 S盒"""
14
    S = list(range(256))
15
    j = 0
16
    key_len = len(key)
17

18
    for i in range(256):
19
        j = (j + S[i] + key[i % key_len]) & 0xFF
20
        S[i], S[j] = S[j], S[i]
21

22
    return S
23

24
def rc4_crypt(S, data):
25
    """RC4加密/解密"""
26
    S = S.copy()
27
    i = j = 0
28
    result = bytearray()
29

30
    for byte in data:
31
        i = (i + 1) & 0xFF
32
        j = (j + S[i]) & 0xFF
33
        S[i], S[j] = S[j], S[i]
34
        k = S[(S[i] + S[j]) & 0xFF]
35
        result.append(byte ^ k)
36

37
    return bytes(result)
38

39
def main():
40
    # 参数验证
41
    if len(sys.argv) != 5:
42
        print(f"Usage: {sys.argv[0]} <so_file> <webp_image> <output_image> <key>")
43
        return 1
44

45
    so_file = sys.argv[1]
46
    webp_image = sys.argv[2]
47
    output_image = sys.argv[3]
48
    key = sys.argv[4].encode('utf-8')
49

50
    with open(so_file, 'rb') as f:
51
        so_data = f.read()
52

53
    with open(webp_image, 'rb') as f:
54
        webp_data = f.read()
55

56
    # RC4加密
57
    S = rc4_init(key)
58
    encrypted_so = rc4_crypt(S, so_data)
59

60
    S_verify = rc4_init(key)
61
    decrypted = rc4_crypt(S_verify, encrypted_so)
62
    if decrypted != so_data:
63
        print("Error: Encryption verification failed!")
64
        return 1
65

66
    with open(output_image, 'wb') as f:
67
        f.write(webp_data)                          # 原始WebP数据
68
        f.write(MAGIC_HEADER)                       # 魔数标识
69
        f.write(struct.pack('<I', len(so_data)))    # 原始SO大小
70
        f.write(encrypted_so)                       # 加密的SO数据
71

72
    print(f"加密完成！隐藏数据起始偏移: {len(webp_data)}")
73
    return 0
74

75
if __name__ == "__main__":
76
    sys.exit(main())

解密流程#

完整的解密加载流程：

资源提取（Java层）
内存映射与解密（Native层）
加载执行（自定义Linker）

1. Java层资源提取#

1
public static String getExtractedImagePath(Context context) {
2
    File tempDir = new File(context.getCacheDir(), "yuuki_temp");
3
    if (!tempDir.exists()) {
4
        tempDir.mkdirs();
5
    }
6
    return new File(tempDir, "temp_image.webp").getAbsolutePath();
7
}
8

9
public static boolean extractImageFromApk(Context context, String outputPath) {
10
    String apkPath = context.getApplicationInfo().sourceDir;
11

12
    try (ZipInputStream zip = new ZipInputStream(new FileInputStream(apkPath))) {
13
        ZipEntry entry;
14
        while ((entry = zip.getNextEntry()) != null) {
15
            if (entry.getName().equals("res/mipmap-xxxhdpi-v4/ic_launcher.webp")) {
16
                File outFile = new File(outputPath);
17
                File parent = outFile.getParentFile();
18
                if (!parent.exists()) {
19
                    parent.mkdirs();
20
                }
21

22
                try (FileOutputStream out = new FileOutputStream(outFile)) {
23
                    byte[] buffer = new byte[1024];
24
                    int len;
25
                    while ((len = zip.read(buffer)) > 0) {
26
                        out.write(buffer, 0, len);
27
                    }
28
                    return true;
29
                }
30
            }
31
            zip.closeEntry();
32
        }
33
    } catch (IOException e) {
34
        e.printStackTrace();
35
    }
36

37
    return false;
38
}

2. Native层解密实现#

在ElfReader中添加解密功能：

1
bool ElfReader::HandleFileType() {
2
    // 检查文件是否包含隐藏的SO
3
    if (CryptoUtils::HasHiddenSO(mapped_file_, file_size_)) {
4
        LOGI("检测到隐藏的SO文件，开始提取并解密...");
5

6
        void* decrypted_data = nullptr;
7
        size_t decrypted_size = 0;
8

9
        if (!CryptoUtils::ExtractAndDecryptHiddenSO(mapped_file_, file_size_,
10
                                                    &decrypted_data, &decrypted_size)) {
11
            LOGE("提取和解密隐藏的SO失败");
12
            return false;
13
        }
14

15
        // 替换映射数据为解密后的数据
16
        decrypted_buffer_ = decrypted_data;
17
        is_decrypted_ = true;
18

19
        // 释放原始映射，使用解密缓冲区
20
        munmap(mapped_file_, file_size_);
21
        mapped_file_ = decrypted_buffer_;
22
        file_size_ = decrypted_size;
23

24
        LOGI("隐藏SO提取和解密成功，大小: %zu", decrypted_size);
25
    }
26

27
    return true;
28
}

解密工具类的核心实现包括：

魔数头定位
RC4解密算法
ELF格式验证
内存管理

这样，自定义Linker就能透明地加载加密的SO文件，实现了简单的SO加固保护

0x05 总结#

本文分析了Android Linker的工作原理，并基于此实现了自定义Linker和SO加固方案。整个项目涉及很多内存操作和底层知识，还是从中学到了很多东西的OvO。希望这篇文章对想了解Linker的同学有所帮助。如果有什么问题或建议，欢迎交流

参考资料：