-
附录 A:其他环境中的 Git
- A1.1 图形界面
- A1.2 Visual Studio 中的 Git
- A1.3 Visual Studio Code 中的 Git
- A1.4 IntelliJ / PyCharm / WebStorm / PhpStorm / RubyMine 中的 Git
- A1.5 Sublime Text 中的 Git
- A1.6 Bash 中的 Git
- A1.7 Zsh 中的 Git
- A1.8 PowerShell 中的 Git
- A1.9 总结
-
附录 B:将 Git 嵌入您的应用程序
-
附录 C:Git 命令
7.5 Git 工具 - 搜索
搜索
在任何规模的代码库中,你经常需要找到函数调用或定义的位置,或者显示方法的历史记录。Git 提供了几个有用的工具,可以让你快速轻松地查找其数据库中存储的代码和提交。我们将介绍其中的一些工具。
Git Grep
Git 附带一个名为 grep
的命令,它允许你轻松地在任何提交的树、工作目录甚至索引中搜索字符串或正则表达式。在以下示例中,我们将搜索 Git 本身的源代码。
默认情况下,git grep
会查看你的工作目录中的文件。作为第一个变体,你可以使用 -n
或 --line-number
选项来打印出 Git 找到匹配项的行号
$ git grep -n gmtime_r
compat/gmtime.c:3:#undef gmtime_r
compat/gmtime.c:8: return git_gmtime_r(timep, &result);
compat/gmtime.c:11:struct tm *git_gmtime_r(const time_t *timep, struct tm *result)
compat/gmtime.c:16: ret = gmtime_r(timep, result);
compat/mingw.c:826:struct tm *gmtime_r(const time_t *timep, struct tm *result)
compat/mingw.h:206:struct tm *gmtime_r(const time_t *timep, struct tm *result);
date.c:482: if (gmtime_r(&now, &now_tm))
date.c:545: if (gmtime_r(&time, tm)) {
date.c:758: /* gmtime_r() in match_digit() may have clobbered it */
git-compat-util.h:1138:struct tm *git_gmtime_r(const time_t *, struct tm *);
git-compat-util.h:1140:#define gmtime_r git_gmtime_r
除了上面显示的基本搜索之外,git grep
还支持许多其他有趣的选项。
例如,你可以让 git grep
不打印所有匹配项,而是通过使用 -c
或 --count
选项,只显示包含搜索字符串的文件以及每个文件中匹配项的数量
$ git grep --count gmtime_r
compat/gmtime.c:4
compat/mingw.c:1
compat/mingw.h:1
date.c:3
git-compat-util.h:2
如果你对搜索字符串的上下文感兴趣,你可以使用 -p
或 --show-function
选项,为每个匹配的字符串显示包含它的方法或函数
$ git grep -p gmtime_r *.c
date.c=static int match_multi_number(timestamp_t num, char c, const char *date,
date.c: if (gmtime_r(&now, &now_tm))
date.c=static int match_digit(const char *date, struct tm *tm, int *offset, int *tm_gmt)
date.c: if (gmtime_r(&time, tm)) {
date.c=int parse_date_basic(const char *date, timestamp_t *timestamp, int *offset)
date.c: /* gmtime_r() in match_digit() may have clobbered it */
如你所见,gmtime_r
函数在 date.c
文件中的 match_multi_number
和 match_digit
函数中都被调用(第三个匹配结果只代表出现在注释中的字符串)。
你也可以使用 --and
标志搜索字符串的复杂组合,它确保多个匹配必须出现在同一行文本中。例如,让我们查找任何定义常量的行,其名称包含“LINK”或“BUF_MAX”子字符串,特别是在由标签 v1.8.0
表示的 Git 代码库的旧版本中(我们将加入 --break
和 --heading
选项,它们有助于将输出拆分为更易读的格式)。
$ git grep --break --heading \
-n -e '#define' --and \( -e LINK -e BUF_MAX \) v1.8.0
v1.8.0:builtin/index-pack.c
62:#define FLAG_LINK (1u<<20)
v1.8.0:cache.h
73:#define S_IFGITLINK 0160000
74:#define S_ISGITLINK(m) (((m) & S_IFMT) == S_IFGITLINK)
v1.8.0:environment.c
54:#define OBJECT_CREATION_MODE OBJECT_CREATION_USES_HARDLINKS
v1.8.0:strbuf.c
326:#define STRBUF_MAXLINK (2*PATH_MAX)
v1.8.0:symlinks.c
53:#define FL_SYMLINK (1 << 2)
v1.8.0:zlib.c
30:/* #define ZLIB_BUF_MAX ((uInt)-1) */
31:#define ZLIB_BUF_MAX ((uInt) 1024 * 1024 * 1024) /* 1GB */
git grep
命令比普通搜索命令(如 grep
和 ack
)有一些优势。第一个是它速度非常快,第二个是你可以搜索 Git 中的任何树,而不仅仅是工作目录。正如我们在上面的例子中看到的,我们在 Git 源代码的旧版本中查找了术语,而不是当前检出的版本。
Git 日志搜索
也许你正在寻找的不是术语的位置,而是它存在或引入的时间。git log
命令提供了许多强大的工具,用于通过其消息内容甚至引入的差异内容来查找特定的提交。
例如,如果我们想找出 ZLIB_BUF_MAX
常量最初引入的时间,我们可以使用 -S
选项(俗称 Git“镐”选项)来告诉 Git 只显示那些更改该字符串出现次数的提交。
$ git log -S ZLIB_BUF_MAX --oneline
e01503b zlib: allow feeding more than 4GB in one go
ef49a7a zlib: zlib can only process 4GB at a time
如果我们查看这些提交的差异,我们会发现 ef49a7a
中引入了该常量,并在 e01503b
中对其进行了修改。
如果你需要更具体,可以使用 -G
选项提供要搜索的正则表达式。
行日志搜索
另一个非常高级且非常有用的日志搜索是行历史搜索。只需运行带有 -L
选项的 git log
,它就会显示代码库中函数或代码行的历史记录。
例如,如果我们想查看 zlib.c
文件中 git_deflate_bound
函数所做的所有更改,我们可以运行 git log -L :git_deflate_bound:zlib.c
。这将尝试找出该函数的边界,然后查看历史记录并向我们展示从创建该函数开始,对该函数所做的所有更改,这些更改将显示为一系列补丁。
$ git log -L :git_deflate_bound:zlib.c
commit ef49a7a0126d64359c974b4b3b71d7ad42ee3bca
Author: Junio C Hamano <[email protected]>
Date: Fri Jun 10 11:52:15 2011 -0700
zlib: zlib can only process 4GB at a time
diff --git a/zlib.c b/zlib.c
--- a/zlib.c
+++ b/zlib.c
@@ -85,5 +130,5 @@
-unsigned long git_deflate_bound(z_streamp strm, unsigned long size)
+unsigned long git_deflate_bound(git_zstream *strm, unsigned long size)
{
- return deflateBound(strm, size);
+ return deflateBound(&strm->z, size);
}
commit 225a6f1068f71723a910e8565db4e252b3ca21fa
Author: Junio C Hamano <[email protected]>
Date: Fri Jun 10 11:18:17 2011 -0700
zlib: wrap deflateBound() too
diff --git a/zlib.c b/zlib.c
--- a/zlib.c
+++ b/zlib.c
@@ -81,0 +85,5 @@
+unsigned long git_deflate_bound(z_streamp strm, unsigned long size)
+{
+ return deflateBound(strm, size);
+}
+
如果 Git 无法弄清楚如何匹配你编程语言中的函数或方法,你也可以提供正则表达式(或正则表达式)。例如,这将与上面的示例执行相同的操作:git log -L '/unsigned long git_deflate_bound/',/^}/:zlib.c
。你也可以提供一行范围或一个单行号,你将获得相同类型的输出。